В парном дизайне «до/после» у части пользователей нет измерения «после» (например, не вернулись). Что корректнее для применения парного t-теста?

AСлучайно дописать недостающие значения «после», чтобы все пары формально стали полными
BИспользовать только полные пары «до/после» или менять метод и дизайн, явно учитывая пропуски
CЗаменить парный тест на критерий хи-квадрат, потому что есть пропуски в части наблюдений
DСравнить средние «до» всех и «после» всех тем же парным тестом, не сверяя пары пользователей
Правильный ответ. Парный t-тест требует, чтобы каждая пара состояла из двух измерений одного и того же объекта.

Разбор

Если для пользователя нет значения «после», разность между «до» и «после» не определена, и парный тест не может корректно использовать такое наблюдение. Обычно берут только полные пары, но важно помнить про риск смещения: ушедшие пользователи могут отличаться от оставшихся. Если пропусков много или они неслучайны, лучше пересмотреть дизайн или метод. Типичная ошибка — механически смешать разные базы «до» и «после» и назвать это парным сравнением.

Проверь себя · 1/3разбор после ответа
Что означает предпосылка «равенство дисперсий» в независимом t-тесте, если объяснять её интуитивно?
Тренировать статистику в Telegram

Ещё вопросы по теме «Тесты для средних»