Question 1

Вы сделали стратификацию по платформе при рандомизации A/B-теста. Какой эффект это даёт в первую очередь?

Accepted Answer

Стратификация по важному фактору (например, платформе) выравнивает состав групп A и B и уменьшает шум и риск случайного перекоса. Если платформа влияет на базовый уровень метрики, небольшой перекос долей iOS и Android между группами может создавать ложный прирост или скрывать настоящий эффект. Стратификация снижает этот риск, потому что баланс по платформе обеспечивается на уровне дизайна эксперимента. Это не гарантирует значимости и не отменяет `CUPED`, который снижает дисперсию через предтестовые ковариаты, и не меняет уровень значимости автоматически. Поэтому корректный ответ — про более ровный состав групп и снижение шума, а не про гарантии и автоматические корректировки.

Question 2

В эксперименте конверсия сильно различается у новых и возвращающихся пользователей, а трафик ограничен. Какой шаг лучше всего снижает шум и риск перекоса сегментов?

Accepted Answer

Стратификация по важному сегменту делает состав групп более ровным и снижает шум оценки эффекта. Если сегменты имеют разные базовые уровни конверсии, случайный перекос долей сегментов между `A` и `B` может имитировать эффект. Стратификация обеспечивает баланс сегментов в каждой группе и часто даёт заметное снижение дисперсии. Это особенно полезно при ограниченном трафике или когда сегменты сильно различаются по поведению.

Question 3

Какие данные нужны, чтобы применить `CUPED` в эксперименте по метрике `revenue_per_user`?

Accepted Answer

`CUPED` требует предэкспериментальную ковариату, измеренную до старта воздействия и коррелирующую с целевой метрикой. Обычно в качестве ковариаты берут то, что предсказывает поведение пользователя: прошлую `revenue_per_user` или `sessions_per_user` в предпериоде. Важно, чтобы ковариата была измерена до старта воздействия и не могла измениться из-за варианта эксперимента, иначе появится систематическое смещение оценки. Если связь ковариаты с целевой метрикой слабая, выигрыш в снижении дисперсии будет небольшим, и применять `CUPED` ради него нет смысла.

Question 4

Перед запуском вы хотите оценить потенциальный выигрыш от `CUPED`. Что вы проверите в первую очередь?

Accepted Answer

Чем выше связь ковариаты на предпериоде с исходом, тем больше снижение дисперсии от `CUPED`. Если ковариата на предпериоде хорошо предсказывает будущую метрику, она объясняет часть разброса между пользователями. `CUPED` убирает эту предсказуемую часть, поэтому стандартная ошибка падает и нужный размер выборки уменьшается. Если связи почти нет, корректировка мало что меняет и усложнение пайплайна не оправдано. Уровень метрики в группе `A` и наличие `SRM` в прошлых тестах сами по себе не определяют пользу `CUPED`.

Question 5

Вы выбираете окно предпериода для `CUPED`. Какое правило самое важное, чтобы избежать утечки данных между группами и смещения оценки эффекта?

Accepted Answer

Главное правило: предпериод полностью до воздействия и одинаково определён для всех; иначе возможны утечка данных и смещение оценки. Если предпериод пересекается с воздействием, ковариата начинает зависеть от варианта, и корректировка вычитает часть самого эффекта. Поэтому окно выбирают полностью перед экспериментом и считают относительно момента назначения варианта. Также важно учитывать сезонность и события, которые могут ломать стабильность связи между предпериодом и послепериодом. Чем аккуратнее определён предпериод, тем безопаснее применение `CUPED`.

Снижение дисперсии и CUPED: вопросы для собеседования (часть 2)

Вопросы 6–10 из 20

Хотите тренировать интерактивно?

Другие темы: A/B-тесты