Эксперимент рандомизируется по user_id, а вы считаете метрику на уровне session_id (например, длительность сессии) и сравниваете сессии как независимые наблюдения. Что здесь главное методологическое последствие?

AНикакого, если сессий много, то независимость гарантирована
BСтандартные ошибки могут быть занижены, потому что сессии одного user_id зависимы, и нужно агрегировать до пользователя или учитывать кластеризацию
CСреднее значение метрики обязательно станет смещенным вверх
DЭто автоматически приводит к SRM (Sample Ratio Mismatch) даже при правильном bucketing (разбивка пользователей на группы)
Правильный ответ. Если unit of analysis мельче unit of randomization (единица рандомизации), наблюдения внутри одного объекта коррелируют и стандартные ошибки могут быть занижены.

Разбор

При рандомизации по user_id независимыми являются пользователи, а не их сессии. У одного пользователя поведение по сессиям часто связано, поэтому считать каждую session_id независимой ошибочно. Это обычно не обязательно смещает средний эффект, но может дать слишком оптимистичные p-value и доверительные интервалы. Типовые решения — агрегировать метрику на user_id или использовать кластерные ошибки на уровне пользователя.

Проверь себя · 1/3разбор после ответа
Почему назначение варианта как variant = random.choice([0, 1]) при каждом запросе пользователя — плохая идея для A/B теста?
Тренировать A/B в Telegram

Ещё вопросы по теме «Дизайн эксперимента и рандомизация»