В парном дизайне «до/после» часть пользователей не имеет измерения «после» (например, не вернулась). Что корректнее для применения paired t-test?

AСлучайно дописать недостающие значения, чтобы пары стали полными
BИспользовать только полные пары (есть «до» и «после») или менять метод/дизайн, явно учитывая пропуски
CЗаменить paired на chi-square, потому что есть пропуски
DСравнить средние «до» всех и «после» всех тем же paired тестом без проверки пар
Правильный ответ. Paired t-test требует, чтобы каждая пара состояла из двух измерений одного объекта.

Разбор

Если нет значения «после», разность d для пользователя не определена, и парный тест не может корректно использовать такое наблюдение. Обычно берут только полные пары, но важно помнить про риск смещения: ушедшие пользователи могут отличаться. Если пропусков много или они неслучайны, лучше пересмотреть дизайн или метод, чтобы вывод оставался валидным. Типичная ошибка — механически смешать разные базы и назвать это парным сравнением.

Проверь себя · 1/3разбор после ответа
В каких условиях предпосылка равенства дисперсий наиболее критична для классического independent t-test с pooled дисперсией?
Тренировать статистику в Telegram

Ещё вопросы по теме «Тесты для средних»