В парном дизайне «до/после» часть пользователей не имеет измерения «после» (например, не вернулась). Что корректнее для применения paired t-test?
AСлучайно дописать недостающие значения, чтобы пары стали полными
BИспользовать только полные пары (есть «до» и «после») или менять метод/дизайн, явно учитывая пропуски
CЗаменить
paired на chi-square, потому что есть пропускиDСравнить средние «до» всех и «после» всех тем же
paired тестом без проверки парПравильный ответ.
Paired t-test требует, чтобы каждая пара состояла из двух измерений одного объекта.Разбор
Если нет значения «после», разность d для пользователя не определена, и парный тест не может корректно использовать такое наблюдение. Обычно берут только полные пары, но важно помнить про риск смещения: ушедшие пользователи могут отличаться. Если пропусков много или они неслучайны, лучше пересмотреть дизайн или метод, чтобы вывод оставался валидным. Типичная ошибка — механически смешать разные базы и назвать это парным сравнением.
Проверь себя · 1/3разбор после ответа
В каких условиях предпосылка равенства дисперсий наиболее критична для классического
independent t-test с pooled дисперсией?Ещё вопросы по теме «Тесты для средних»
- Вы измерили среднее время выполнения задачи у тех же 40 пользователей «до» и «после» изменения интерфейса. Какой тест для сравнения средних здесь уместен?
- В A/B эксперименте пользователи случайно распределены: группа A видит старую страницу, группа B — новую; пользователи не пересекаются. Какой тест сравнения средних подходит для сравнения метрики `revenue_per_user`?
- Как выглядит стандартная нулевая гипотеза `H0` в двухвыборочном `t-test` для средних?
- Вы получили `CI 95%` для разницы средних A−B: `[-1.2; 0.4]`. Что это означает на уровне значимости `alpha = 0.05`?
- Какая «нормальность (интуитивно)» важна для парного `paired` `t-test`?
- Все вопросы по «Тесты для средних» →