Question 1

В каком случае применение `CUPED` чаще всего почти не даст снижения дисперсии целевой метрики?

Accepted Answer

Если ковариата с предпериода почти не связана с метрикой на постпериоде, `CUPED` почти не снижает дисперсию. `CUPED` уменьшает шум за счёт объяснения части вариативности через ковариату с предпериода. Если ковариата почти ничего не предсказывает, то и вычитать нечего, поэтому дисперсия почти не меняется. В таком случае усложнение расчётов может не окупиться. `CUPED` применим и к большим выборкам, и к бинарным метрикам, а стратификация и `CUPED` — взаимодополняющие техники, а не замена друг другу.

Question 2

Зачем в `A/B` тестах применяют методы снижения дисперсии вроде `CUPED`?

Accepted Answer

`CUPED` снижает шум метрики и сужает доверительный интервал при той же выборке, не добавляя смещения при корректном применении. Идея в том, чтобы использовать дополнительную информацию (например, ковариату из предтестового периода), которая объясняет часть разброса исхода. Тогда стандартная ошибка уменьшается, а доверительный интервал сужается, что позволяет быстрее получить устойчивый вывод. При корректном применении `CUPED` не вносит смещение: метод снижает дисперсию, но не меняет ожидаемое значение эффекта. Завышение эффекта или гарантированное снижение `p-value` — это уже не снижение дисперсии, а подтасовка.

Question 3

Можно ли одновременно использовать стратификацию при рандомизации и `CUPED` на этапе анализа?

Accepted Answer

Да: стратификация работает на дизайне (баланс групп), а `CUPED` — на анализе (снижение дисперсии через предтестовую ковариату). Стратификация влияет на дизайн эксперимента: она снижает риск дисбаланса групп по важным факторам ещё до запуска. `CUPED` влияет на анализ: использует предтестовую ковариату, не затронутую воздействием, чтобы уменьшить дисперсию оценки эффекта. В комбинации методы часто дают более стабильные результаты при условии, что их применяют последовательно и заранее планируют. Совпадение переменной стратификации и ковариаты допустимо, но обычно не нужно: они решают разные задачи и хорошо работают вместе.

Question 4

Что означает блокирование (blocking) в дизайне `A/B`-теста?

Accepted Answer

Блокирование снижает дисперсию и риск дисбаланса, выполняя рандомизацию внутри заранее заданных блоков. Если платформа или страна сильно влияют на метрику, случайный перекос их долей между тестовой и контрольной группами добавляет шум. Блокирование (или стратификация) делает так, что внутри каждого блока доли вариантов примерно одинаковы. Это уменьшает вариативность итоговой оценки и повышает мощность. Блоки нужно определять до запуска и не строить на поведении после старта.

Question 5

Какой признак наиболее удачен для стратификации в `A/B`-тесте метрики конверсии, если известно, что тип платформы сильно влияет на базовый уровень?

Accepted Answer

Для стратификации подходят предэкспериментальные факторы, которые заметно влияют на метрику и не зависят от варианта. Хороший признак для стратификации объясняет различия пользователей и может уменьшить шум, но не должен зависеть от воздействия. Платформа часто влияет на базовый уровень конверсии, поэтому баланс по ней снижает риск случайного перекоса. Нельзя строить стратификацию по постпериодному поведению, потому что это приводит к утечке информации и может внести смещение оценки.

Вопросы по теме «Снижение дисперсии и CUPED»

Вопросы 1–5 из 20

Хотите тренировать интерактивно?

Другие темы: A/B-тесты