Метрика revenue per user очень шумная: есть редкие большие чеки, из-за чего variance высокая и sample size растет. Что чаще всего уменьшит требуемый sample size при неизменных alpha и power, не меняя смысл метрики полностью?

AУбрать из анализа всех пользователей с покупками, тогда variance станет нулевой
BПовысить alpha, чтобы выборка стала меньше
CДобавить еще один вариант C, чтобы было больше наблюдений
DСнизить variance метрики, например применив winsorization (усечение выбросов до процентиля) или trimming для уменьшения влияния выбросов
Правильный ответ. Снижение variance метрики через устойчивую агрегацию часто уменьшает необходимый sample size при заданных alpha и power.

Разбор

Метрики с тяжелыми хвостами дают большую variance, из-за чего требуется больше данных для стабильной оценки среднего. Устойчивые техники вроде winsorization (усечение выбросов до процентиля) или trimming уменьшают влияние редких экстремальных значений, сохраняя интерпретацию близкой к исходной метрике. Это снижает variance и, как следствие, уменьшает требуемый sample size при тех же alpha и power.

Проверь себя · 1/3разбор после ответа
Вы повышаете требование к power с 80% до 90% при фиксированных alpha и MDE. Что ожидаемо случится с sample size?
Тренировать A/B в Telegram

Ещё вопросы по теме «Размер выборки и мощность теста»