Вы тестируете новый ранжирующий алгоритм, который заметно меняет число показов на пользователя; при этом CTR вырос. Что правильно сделать перед выводом, что качество кликов улучшилось?
AСчитать рост
CTR доказательством улучшения, потому что знаменатель не важенBЗаменить метод на
t-test по пользовательскому CTR без взвешивания, и интерпретация станет корректнойCСмотреть только на
p-value по CTR и не анализировать компоненты метрикиDПроверить отдельно изменения кликов и показов (например клики на пользователя и показы на пользователя) и оценить, не связан ли рост
CTR с изменением знаменателяПравильный ответ. Если вариант влияет на знаменатель
ratio metric, нужно разложить метрику на компоненты (числитель/знаменатель) и проверить метрики экспозиции до вывода про «качество».Разбор
Рост CTR может возникнуть из-за сокращения показов при относительно меньшем сокращении кликов, и это не всегда означает лучший ранжир. Поэтому важно смотреть на клики и показы отдельно, а также на метрики на пользователя, чтобы понять механизм эффекта. Статистически это также сигнал, что наивный анализ долей может быть недостаточен, и стоит выбирать delta method (дельта-метод для ratio-метрик) или bootstrap на правильной единице.
Проверь себя · 1/3разбор после ответа
В чем основная идея
delta method (дельта-метод для ratio-метрик) при оценке разницы ratio metric между вариантами?Ещё вопросы по теме «Ratio-метрики и бутстреп»
- Какая из метрик является `ratio metric`?
- Вы считаете `ARPU` в эксперименте; что является числителем и знаменателем этой метрики?
- Есть таблица по пользователям с колонками conversions (число конверсий) и visits (число визитов). Вы хотите получить групповой `conversion rate` по визитам; какой расчет корректен?
- Почему анализ `ratio metric` вроде `CTR` часто нельзя делать как «обычный средний показатель» без оговорок?
- Есть две кампании: (1) 1 клик и 1 показ, (2) 9 кликов и 99 показов. Чему равен общий `CTR` по двум кампаниям при корректной агрегации?
- Все вопросы по «Ratio-метрики и бутстреп» →