Вы применили классический независимый t-test с предпосылкой равенства дисперсий и получили p-value=0.04, но видите, что стандартные отклонения в группах сильно отличаются. Что разумнее сделать перед финальным выводом?
AСразу принять результат, потому что
p-value уже меньше 0.05 и формальный порог значимости пройденBПересчитать
Welch t-test и сравнить выводы и CI, явно указав, что дисперсии в группах неравныCЗаменить независимый
t-test на парный, чтобы предпосылка равенства дисперсий в pooled выполниласьDУвеличить порог значимости
alpha до 0.1, чтобы вывод стал устойчивее к разнице стандартных отклоненийПравильный ответ. При сомнительном равенстве дисперсий
Welch t-test обычно даёт более надёжный вывод по p-value и CI.Разбор
Сильно разные стандартные отклонения — сигнал, что объединённая (pooled) предпосылка может быть неверной, и стандартная ошибка могла быть оценена некорректно. Welch t-test лучше учитывает неравные дисперсии и часто меняет p-value и CI. Если вывод меняется, это важная часть истории: решение нужно принимать по корректной модели. Типичная ошибка — фиксироваться на первом p-value и не проверять чувствительность к предпосылкам.
Проверь себя · 1/3разбор после ответа
Что означает
p-value в контексте t-test при сравнении двух средних?Ещё вопросы по теме «Тесты для средних»
- Вы измерили среднее время выполнения задачи у одних и тех же 40 пользователей до и после изменения интерфейса. Какой тест для сравнения средних здесь уместен?
- В A/B эксперименте пользователи случайно распределены: группа A видит старую страницу, группа B — новую; пользователи не пересекаются. Какой тест сравнения средних подходит для метрики `revenue_per_user`?
- Как выглядит стандартная нулевая гипотеза `H0` в двухвыборочном `t-test` для средних?
- Вы получили `CI 95%` для разницы средних A−B: `[-1.2; 0.4]`. Что это означает на уровне значимости `alpha = 0.05`?
- Какая «нормальность» (интуитивно) важна для парного `t-test` при сравнении до и после?
- Все вопросы по «Тесты для средних» →