20 пользователей по очереди используют два дизайна (A и B), и для каждого пользователя измерено время выполнения задачи в обоих вариантах. Какой t-test подходит для сравнения средних времен?
AПарный
paired t-testBНепарный
independent t-testC
chi-square тест по частотамDТест на равенство дисперсий вместо теста для средних
Правильный ответ. Если один и тот же пользователь измеряется в A и B, это парные наблюдения.
Разбор
В кроссовер дизайне каждое наблюдение в A связано с наблюдением в B для того же пользователя. Парный тест использует разности по пользователю и обычно даёт более точное сравнение. Типичная ошибка — игнорировать парность и сравнивать как независимые группы.
Проверь себя · 1/3разбор после ответа
Что означает
p-value в контексте t-test?Ещё вопросы по теме «Тесты для средних»
- Вы измерили среднее время выполнения задачи у тех же 40 пользователей «до» и «после» изменения интерфейса. Какой тест для сравнения средних здесь уместен?
- В A/B эксперименте пользователи случайно распределены: группа A видит старую страницу, группа B — новую; пользователи не пересекаются. Какой тест сравнения средних подходит для сравнения метрики `revenue_per_user`?
- Как выглядит стандартная нулевая гипотеза `H0` в двухвыборочном `t-test` для средних?
- Вы получили `CI 95%` для разницы средних A−B: `[-1.2; 0.4]`. Что это означает на уровне значимости `alpha = 0.05`?
- Какая «нормальность (интуитивно)» важна для парного `paired` `t-test`?
- Все вопросы по «Тесты для средних» →