Какую проверку разумно сделать до обсуждения эффекта по primary metric, чтобы быстрее поймать проблемы качества данных и SRM?

AПроверить только финальную метрику и игнорировать всё остальное
BПроверить баланс групп и базовые инварианты (размеры control/treatment, платформы, страны) и убедиться, что нет SRM
CУдалить пользователей с редкими событиями, чтобы метрика стала стабильнее
DСмешать control и treatment в одну группу и пересчитать метрику
Правильный ответ. Санити-проверки и поиск SRM помогают убедиться, что сравнение control/treatment корректно ещё до интерпретации эффекта.

Разбор

Даже хороший эксперимент может быть испорчен ошибкой назначения, фильтрами или логированием. Проверка размеров групп и базового состава по сегментам помогает заметить SRM и перекосы. Если такие проблемы есть, обсуждать эффект по primary metric бессмысленно, пока не восстановлена валидность данных.

Проверь себя · 1/3разбор после ответа
Вы тестируете новую страницу товара; цель — увеличить покупки. Какая метрика наиболее логична как primary metric для решения о запуске?
Тренировать продукт в Telegram

Ещё вопросы по теме «A/B-тесты в продуктовой аналитике»