Почему SRM (расхождение долей трафика по группам) опасен, даже если целевая метрика выглядит хорошей?

ASRM влияет только на оформление графиков мониторинга и не затрагивает статистику, поэтому выводы по эксперименту остаются корректными
BПри обнаружении SRM достаточно пересчитать p-value с поправкой на наблюдаемое разбиение, и проблема исчезнет без дальнейшей диагностики причин
CSRM всегда означает, что в эксперименте по факту выиграл вариант B, и это просто способ зафиксировать наблюдаемое смещение результата
DSRM может означать несопоставимые группы и смещение оценки эффекта, поэтому выводы по эксперименту становятся ненадёжными до устранения причины
Правильный ответ. SRM нарушает предпосылку корректного сравнения групп и может смещать оценку эффекта эксперимента.

Разбор

Если фактические доли трафика по группам не соответствуют ожидаемому разбиению, это часто значит, что в эксперимент попали разные типы пользователей или часть трафика пропала. Тогда даже «красивый» эффект может быть артефактом. Поэтому при обнаружении SRM обычно сначала чинят причину и только потом доверяют результатам.

Проверь себя · 1/3разбор после ответа
Вы запустили A/A тест и получили статистически значимую разницу по ключевой метрике. Что правильнее всего сделать перед запуском A/B?
Тренировать A/B в Telegram

Ещё вопросы по теме «QA, SRM и раскатка»