20 пользователей по очереди используют два дизайна (`A` и `B`), и для каждого пользователя измерено время выполнения задачи в обоих вариантах. Какой `t-test` подходит для сравнения средних времён?

Question

Карьерник · Accepted Answer

Правильный ответ: Парный `t-test` на разностях времени между вариантами `A` и `B` для каждого пользователя. Если один и тот же пользователь измеряется в `A` и `B`, это парные наблюдения и нужен парный `t-test`. В кроссовер-дизайне каждое наблюдение в `A` связано с наблюдением в `B` для того же пользователя. Парный тест работает с разностями по пользователю и обычно даёт более точное сравнение, чем непарный. Типичная ошибка — игнорировать парность и сравнивать как независимые группы, теряя точность из-за межпользовательской вариации.

Разбор

Ещё вопросы по теме «Тесты для средних»