A/B тест: пользователи случайно распределены по группам, но у каждого много сессий. Вы агрегировали метрику до уровня пользователя `user_mean` и сравниваете группы. Какой тест по дизайну подходит лучше всего?

Question

Карьерник · Accepted Answer

Правильный ответ: Непарный `t-test` для двух независимых выборок, потому что группы пользователей не пересекаются. После агрегации до пользователя сравнение идёт между разными группами пользователей — дизайн независимых выборок. Ключевой вопрос — пересекаются ли объекты сравнения: пользователь относится либо к A, либо к B. Если метрика сведена к одному числу на пользователя, наблюдения независимы между группами, и подходит непарный `t-test`. Типичная ошибка — тестировать по сессиям без агрегации и получить псевдоувеличение n из-за зависимости внутри пользователя.

Разбор

Ещё вопросы по теме «Тесты для средних»