Вы выбираете окно предпериода для CUPED. Какое правило самое важное, чтобы избежать утечки данных между группами и смещения оценки эффекта?

AПредпериод должен пересекаться с экспериментом, чтобы связь с послепериодом была сильнее и CUPED забирал больше дисперсии
BПредпериод должен быть полностью до старта воздействия и считаться одинаково для всех пользователей, чтобы ковариата не зависела от варианта
CПредпериод стоит брать как можно длиннее без ограничений, даже если в него попадают нерелевантные промо-периоды и сезонные всплески
DПредпериод можно брать частично после запуска варианта, если так удобнее считать ковариату для большинства пользователей
Правильный ответ. Главное правило: предпериод полностью до воздействия и одинаково определён для всех; иначе возможны утечка данных и смещение оценки.

Разбор

Если предпериод пересекается с воздействием, ковариата начинает зависеть от варианта, и корректировка вычитает часть самого эффекта. Поэтому окно выбирают полностью перед экспериментом и считают относительно момента назначения варианта. Также важно учитывать сезонность и события, которые могут ломать стабильность связи между предпериодом и послепериодом. Чем аккуратнее определён предпериод, тем безопаснее применение CUPED.

Проверь себя · 1/3разбор после ответа
Вы тестируете новый экран, целевая метрика — конверсия. Какую ковариату нельзя использовать в CUPED, чтобы не получить утечку и смещение оценки?
Тренировать A/B в Telegram

Ещё вопросы по теме «Снижение дисперсии и CUPED»