Когда предпосылка о нормальности распределения обычно становится особенно важной для выводов t-test?
AКогда размер выборки очень большой (например, 1 000 000 наблюдений) и среднее уже близко к нормально распределённому
BКогда дисперсии в группах идеально равны и оценка стандартной ошибки строится по объединённой выборке без поправок
CКогда
p-value уже посчитано и нужно лишь интерпретировать его в терминах принятия или отклонения нулевой гипотезыDКогда выборки маленькие и распределение сильно скошено или содержит выбросы, влияющие на устойчивость оценок
Правильный ответ. При маленьких выборках сильная ненормальность может заметно влиять на корректность
t-test.Разбор
При больших выборках среднее часто становится близким к нормальному из-за эффекта усреднения, и t-test обычно устойчивее. При малых выборках и сильных перекосах или выбросах стандартные предпосылки могут нарушаться, и результат становится менее надёжным. Типичная ошибка — игнорировать форму распределения при выборках в 20–30 наблюдений и принимать выводы без проверки здравого смысла.
Проверь себя · 1/3разбор после ответа
Для двух независимых групп вы видите, что разброс метрики сильно отличается. Какой вариант
t-test обычно предпочтительнее при сомнениях в равенстве дисперсий?Ещё вопросы по теме «Тесты для средних»
- Вы измерили среднее время выполнения задачи у одних и тех же 40 пользователей до и после изменения интерфейса. Какой тест для сравнения средних здесь уместен?
- В A/B эксперименте пользователи случайно распределены: группа A видит старую страницу, группа B — новую; пользователи не пересекаются. Какой тест сравнения средних подходит для метрики `revenue_per_user`?
- Как выглядит стандартная нулевая гипотеза `H0` в двухвыборочном `t-test` для средних?
- Вы получили `CI 95%` для разницы средних A−B: `[-1.2; 0.4]`. Что это означает на уровне значимости `alpha = 0.05`?
- Какая «нормальность» (интуитивно) важна для парного `t-test` при сравнении до и после?
- Все вопросы по «Тесты для средних» →