Question 1

Почему `bootstrap` часто используют для метрик-отношений, например ARPU или CTR?

Accepted Answer

`bootstrap` строит эмпирическое распределение метрики-отношения, что помогает при асимметрии, выбросах и нелинейности. ARPU часто имеет тяжёлые хвосты, а отношение сумм в CTR является нелинейной функцией данных. `bootstrap` пересчитывает метрику на множестве ресэмплированных выборок и позволяет оценить стандартную ошибку и построить доверительный интервал без строгих параметрических допущений. Это особенно полезно, когда нормальная аппроксимация сомнительна.

Question 2

У вас по дням есть `clicks`, `impressions` и дневной `CTR`. Как правильно получить недельный `CTR`?

Accepted Answer

Недельный `CTR` корректно считается как сумма `clicks` за неделю, делённая на сумму `impressions` за неделю. Дни с разным числом показов имеют разный вклад в общую долю кликов на показ. Простое среднее дневных `CTR` приравнивает маленький день к большому и даёт смещение. Отношение сумм `clicks` к сумме `impressions` эквивалентно средневзвешенному дневных `CTR` с весами `impressions`. Максимум за день — это пиковая точка, а не агрегация по неделе.

Question 3

Вы посчитали пользовательские доли клики/показы и хотите получить групповой `CTR`. Что нужно сделать, чтобы итог совпал с суммарными кликами по сумме показов?

Accepted Answer

Взвешивание по знаменателю делает среднее долей эквивалентным отношению сумм для метрики-отношения. Пользователь с одним показом и пользователь с тысячей показов не должны влиять на общий `CTR` одинаково. Взвешивание по числу показов даёт каждому пользователю вклад пропорционально его знаменателю. В результате получается тот же групповой `CTR`, что и при прямом вычислении суммы кликов делённой на сумму показов.

Question 4

В чём основная идея дельта-метода при оценке разницы метрик-отношений между вариантами?

Accepted Answer

Дельта-метод использует линейное приближение нелинейной функции (например, отношения) для оценки её дисперсии и доверительного интервала. Для метрик вида отношение сумм точное распределение часто неудобно для анализа. Дельта-метод заменяет нелинейную функцию (например, отношение) её линейным приближением через ряд Тейлора около средних. Это даёт аналитическую формулу для дисперсии, после которой можно строить доверительный интервал и считать `p-value` как для «обычных» средних в асимптотическом режиме. Симуляции и перестановочные тесты — это другие подходы, они не используют линеаризацию, а точное распределение отношения сумм в общем случае не считают.

Question 5

Вы сравниваете CTR на очень большом трафике; у каждого пользователя много показов, нулевых знаменателей почти нет. Какой метод обычно даёт хороший баланс точности и скорости?

Accepted Answer

При больших выборках и стабильном знаменателе дельта-метод часто достаточно точен и быстрее `bootstrap`. Для CTR с большим числом показов асимптотические приближения обычно работают хорошо. Дельта-метод даёт адекватную стандартную ошибку для ratio-метрики и быстро считается на миллионах строк. `bootstrap` может служить проверкой или использоваться при сомнениях в предположениях, но вычислительно дороже. Перестановочный тест по показам игнорирует кластеризацию по пользователю, а `Mann–Whitney` по пользовательскому CTR не учитывает разное число показов и теряет мощность.

Ratio-метрики и бутстреп: вопросы для собеседования (часть 2)

Вопросы 6–10 из 20

Хотите тренировать интерактивно?

Другие темы: A/B-тесты