После применения `CUPED` дисперсия метрики стала в 2 раза меньше. Что это примерно означает для размера выборки, чтобы детектировать тот же эффект при той же мощности?

Question

Карьерник · Accepted Answer

Правильный ответ: Нужна примерно в 2 раза меньшая выборка, потому что требуемый объём примерно пропорционален дисперсии метрики. Если дисперсия упала в 2 раза, для детекта того же эффекта часто нужно примерно в 2 раза меньше наблюдений (приближённо `N ~ variance`). Если дисперсия уменьшилась в 2 раза, стандартная ошибка обычно падает, и сигнал легче отделить от шума. Поэтому для детекта того же эффекта часто требуется примерно в 2 раза меньше наблюдений. Это приближение: точная экономия зависит от распределения метрики, дизайна теста и выбранного критерия. Уменьшение в 4 раза предполагало бы пропорциональность объёма квадрату дисперсии, что не соответствует формуле размера выборки.

После применения `CUPED` дисперсия метрики стала в 2 раза меньше. Что это примерно означает для размера выборки, чтобы детектировать тот же эффект при той же мощности?

Разбор

Ещё вопросы по теме «Снижение дисперсии и CUPED»

После применения CUPED дисперсия метрики стала в 2 раза меньше. Что это примерно означает для размера выборки, чтобы детектировать тот же эффект при той же мощности?

Разбор

Ещё вопросы по теме «Снижение дисперсии и CUPED»

После применения `CUPED` дисперсия метрики стала в 2 раза меньше. Что это примерно означает для размера выборки, чтобы детектировать тот же эффект при той же мощности?