Вы сравниваете ARPU, но видите редкие очень крупные покупки и сильные выбросы; в каждом варианте около 10 тысяч пользователей. Что разумнее выбрать в первую очередь?

Question

Карьерник · Accepted Answer

Правильный ответ: Использовать бутстрэп по пользователям и построить доверительный интервал для разницы средних ARPU между вариантами. При тяжёлых хвостах и выбросах в ARPU бутстрэп часто предпочтительнее параметрических приближений. Выбросы делают распределение среднего сильно несимметричным, и нормальная аппроксимация может работать плохо. Бутстрэп позволяет эмпирически оценить неопределённость и построить доверительный интервал для разницы вариантов, не опираясь на нормальность. Дельта-метод полезен, но без диагностики его нельзя считать заведомо лучше, а `t-test` без проверки хвостов рискует дать заниженный `p-value`. Дополнительно полезно смотреть на компоненты: долю платящих и средний чек среди платящих, чтобы понять источник эффекта.

Вы сравниваете ARPU, но видите редкие очень крупные покупки и сильные выбросы; в каждом варианте около 10 тысяч пользователей. Что разумнее выбрать в первую очередь?

Разбор

Ещё вопросы по теме «Ratio-метрики и бутстреп»