Вы выбираете окно pre-period для CUPED (Controlled-experiment Using Pre-Experiment Data). Какое правило самое важное, чтобы избежать leakage (утечка данных между группами) и bias?
A
pre-period должен пересекаться с экспериментом, чтобы связь с post-period была выше.B
pre-period должен быть полностью до старта воздействия и считаться одинаково для всех пользователей, чтобы covariate не зависела от варианта.C
pre-period должен быть как можно длиннее без ограничений, даже если в него попадают нерелевантные промо-периоды.D
pre-period можно брать после запуска варианта, если это удобнее для расчёта.Правильный ответ. Главное правило:
pre-period полностью до воздействия и одинаково определён для всех; иначе возможны leakage (утечка данных между группами) и bias.Разбор
Если pre-period пересекается с воздействием, covariate начинает зависеть от варианта, и корректировка может вычитать часть effect. Обычно окно pre-period выбирают сразу перед экспериментом и считают относительно момента назначения варианта. Также важно учитывать сезонность и события, которые могут ломать стабильность связи между pre-period и post-period. Чем аккуратнее определён pre-period, тем безопаснее применение CUPED (Controlled-experiment Using Pre-Experiment Data).
Проверь себя · 1/3разбор после ответа
Вы тестируете новый экран, целевая метрика
conversion. Какую covariate (ковариата — вспомогательная переменная) нельзя использовать в CUPED (Controlled-experiment Using Pre-Experiment Data), чтобы не получить leakage (утечка данных между группами) и bias?Ещё вопросы по теме «Снижение дисперсии и CUPED»
- Зачем в `A/B` тестах применяют методы `variance reduction` вроде `CUPED` (Controlled-experiment Using Pre-Experiment Data)?
- Какие данные нужны, чтобы применить `CUPED` (Controlled-experiment Using Pre-Experiment Data) в эксперименте по метрике `revenue_per_user`?
- Вы тестируете новый экран, целевая метрика `conversion`. Какую `covariate` (ковариата — вспомогательная переменная) нельзя использовать в `CUPED` (Controlled-experiment Using Pre-Experiment Data), чтобы не получить `leakage` (утечка данных между группами) и `bias`?
- Что означает `blocking` в дизайне `A/B` теста?
- В эксперименте метрика `conversion` сильно различается у `new_users` и `returning_users`, а трафик ограничен. Какой шаг лучше всего снижает шум и риск перекоса сегментов?
- Все вопросы по «Снижение дисперсии и CUPED» →