Эксперимент рандомизируется по пользователям, а метрика CTR считается как клики/показы. Как корректнее всего настроить bootstrap для оценки разницы вариантов?
AРесэмплировать отдельные показы, игнорируя принадлежность пользователю
BРесэмплировать клики и показы отдельно друг от друга
CРесэмплировать только дни и считать
CTR по днямDРесэмплировать пользователей с возвращением в каждом варианте и каждый раз пересчитывать отношение сумм
Правильный ответ. В
bootstrap нужно ресэмплировать на уровне единицы рандомизации и пересчитывать ratio metric как отношение сумм.Разбор
Если рандомизация по пользователю, внутри пользователя наблюдения зависимы и это нужно сохранять. Поэтому в каждом бутстрап-репликате выбирают пользователей с возвращением, суммируют клики и показы по выбранным пользователям и считают CTR. Так получают эмпирическое распределение эффекта без жестких предположений о форме распределения.
Проверь себя · 1/3разбор после ответа
Вы сравниваете
CTR на очень большом трафике; у каждого пользователя много показов, нулевых знаменателей почти нет. Какой метод обычно дает хороший баланс точности и скорости?Ещё вопросы по теме «Ratio-метрики и бутстреп»
- Какая из метрик является `ratio metric`?
- Вы считаете `ARPU` в эксперименте; что является числителем и знаменателем этой метрики?
- Есть таблица по пользователям с колонками conversions (число конверсий) и visits (число визитов). Вы хотите получить групповой `conversion rate` по визитам; какой расчет корректен?
- Почему анализ `ratio metric` вроде `CTR` часто нельзя делать как «обычный средний показатель» без оговорок?
- Есть две кампании: (1) 1 клик и 1 показ, (2) 9 кликов и 99 показов. Чему равен общий `CTR` по двум кампаниям при корректной агрегации?
- Все вопросы по «Ratio-метрики и бутстреп» →