Какие данные нужны, чтобы применить CUPED в эксперименте по метрике revenue_per_user?

AДостаточно знать итоговый p-value эксперимента, CUPED вычисляется по нему автоматически после остановки сбора данных.
BНужно, чтобы группы имели разный размер по числу пользователей, иначе формула CUPED для скорректированной метрики не сработает корректно.
CНужна предэкспериментальная ковариата (до воздействия), связанная с revenue_per_user в постпериоде, измеренная по тем же пользователям.
DНужна только сегментация пользователей после эксперимента по результатам метрики, предэкспериментальные данные для CUPED не требуются.
Правильный ответ. CUPED требует предэкспериментальную ковариату, измеренную до старта воздействия и коррелирующую с целевой метрикой.

Разбор

Обычно в качестве ковариаты берут то, что предсказывает поведение пользователя: прошлую revenue_per_user или sessions_per_user в предпериоде. Важно, чтобы ковариата была измерена до старта воздействия и не могла измениться из-за варианта эксперимента, иначе появится систематическое смещение оценки. Если связь ковариаты с целевой метрикой слабая, выигрыш в снижении дисперсии будет небольшим, и применять CUPED ради него нет смысла.

Проверь себя · 1/3разбор после ответа
После применения CUPED дисперсия метрики стала в 2 раза меньше. Что это примерно означает для размера выборки, чтобы детектировать тот же эффект при той же мощности?
Тренировать A/B в Telegram

Ещё вопросы по теме «Снижение дисперсии и CUPED»