Вы измерили среднее время выполнения задачи у одних и тех же 40 пользователей до и после изменения интерфейса. Какой тест для сравнения средних здесь уместен?

AПарный t-test по разностям до и после, потому что измерения сделаны у одних и тех же 40 пользователей
BНепарный t-test для двух независимых выборок, считая «до» и «после» разными случайными группами пользователей
CТест chi-square для категориальных данных, ошибочно применённый к непрерывной метрике времени выполнения задачи
Dz-test для долей, ошибочно применённый к среднему времени, потому что выборка превышает 30 наблюдений
Правильный ответ. Если измерения сделаны у одних и тех же объектов до и после, выбирайте парный t-test по разностям.

Разбор

В парном дизайне каждое наблюдение «после» связано с конкретным «до», поэтому анализируют разности d = after - before. Это обычно уменьшает шум и повышает чувствительность по сравнению с непарным тестом. Частая ошибка — считать группы независимыми и терять информацию о парности или применять тесты для долей и категорий к непрерывной метрике времени.

Проверь себя · 1/3разбор после ответа
Для какой метрики t-test для средних наиболее естественен?
Тренировать статистику в Telegram

Ещё вопросы по теме «Тесты для средних»