В A/B тесте разница средних всего 0.1%, но p-value < 0.001 из-за очень большого n. Что корректнее всего сказать про результат?
AЭффект обязательно большой, раз
p-value такой маленькийBЭффекта нет, потому что разница всего 0.1%
CЭффект статистически значим, но может быть практически мал; важно смотреть величину эффекта и
CIDМожно утверждать, что
H0 истинна с вероятностью 0.999Правильный ответ. Малый
p-value говорит про статистическую значимость, но не про практическую важность эффекта.Разбор
При огромных выборках даже очень маленькие эффекты становятся статистически значимыми. Поэтому рядом с p-value нужно смотреть оценку эффекта и CI, чтобы понять масштаб и неопределённость. Типичная ошибка — принимать 'значимо' за 'важно для бизнеса' без оценки величины и стоимости изменений.
Проверь себя · 1/3разбор после ответа
Какая «нормальность (интуитивно)» важна для парного
paired t-test?Ещё вопросы по теме «Тесты для средних»
- Вы измерили среднее время выполнения задачи у тех же 40 пользователей «до» и «после» изменения интерфейса. Какой тест для сравнения средних здесь уместен?
- В A/B эксперименте пользователи случайно распределены: группа A видит старую страницу, группа B — новую; пользователи не пересекаются. Какой тест сравнения средних подходит для сравнения метрики `revenue_per_user`?
- Как выглядит стандартная нулевая гипотеза `H0` в двухвыборочном `t-test` для средних?
- Вы получили `CI 95%` для разницы средних A−B: `[-1.2; 0.4]`. Что это означает на уровне значимости `alpha = 0.05`?
- Какая «нормальность (интуитивно)» важна для парного `paired` `t-test`?
- Все вопросы по «Тесты для средних» →