В эксперименте обнаружили SRM (Sample Ratio Mismatch): доля пользователей в варианте B заметно выше ожидаемой. Поможет ли CUPED (Controlled-experiment Using Pre-Experiment Data) решить эту проблему?
AДа,
CUPED (Controlled-experiment Using Pre-Experiment Data) автоматически исправляет SRM (Sample Ratio Mismatch), потому что снижает variance.BДа, если выбрать
covariate из pre-period.CНет,
CUPED (Controlled-experiment Using Pre-Experiment Data) не исправляет проблемы randomization вроде SRM (Sample Ratio Mismatch); сначала нужно найти причину дисбаланса.DНет, но
stratification после эксперимента всегда полностью чинит SRM (Sample Ratio Mismatch).Правильный ответ. Нет:
CUPED (Controlled-experiment Using Pre-Experiment Data) снижает variance при корректной рандомизации, но не исправляет проблемы назначения трафика (SRM (Sample Ratio Mismatch)).Разбор
SRM (Sample Ratio Mismatch) обычно сигнализирует о проблеме в назначении вариантов или трекинге. Если базовая рандомизация сломана, любые методы variance reduction, включая CUPED (Controlled-experiment Using Pre-Experiment Data), не гарантируют корректности и могут дать вводящие в заблуждение результаты. Поэтому сначала проверяют источники SRM (Sample Ratio Mismatch), а уже потом применяют CUPED (Controlled-experiment Using Pre-Experiment Data) для повышения точности.
Проверь себя · 1/3разбор после ответа
Эксперимент проводится на офлайн-точках, а метрика
revenue сильно зависит от store и day-of-week. Как корректнее применить blocking при назначении A и B?Ещё вопросы по теме «Снижение дисперсии и CUPED»
- Зачем в `A/B` тестах применяют методы `variance reduction` вроде `CUPED` (Controlled-experiment Using Pre-Experiment Data)?
- Какие данные нужны, чтобы применить `CUPED` (Controlled-experiment Using Pre-Experiment Data) в эксперименте по метрике `revenue_per_user`?
- Вы тестируете новый экран, целевая метрика `conversion`. Какую `covariate` (ковариата — вспомогательная переменная) нельзя использовать в `CUPED` (Controlled-experiment Using Pre-Experiment Data), чтобы не получить `leakage` (утечка данных между группами) и `bias`?
- Что означает `blocking` в дизайне `A/B` теста?
- В эксперименте метрика `conversion` сильно различается у `new_users` и `returning_users`, а трафик ограничен. Какой шаг лучше всего снижает шум и риск перекоса сегментов?
- Все вопросы по «Снижение дисперсии и CUPED» →