Эксперимент рандомизируется по пользователям, а метрика CTR считается как клики/показы. Как корректнее всего настроить bootstrap для оценки разницы вариантов?

AРесэмплировать отдельные показы, игнорируя принадлежность пользователю
BРесэмплировать клики и показы отдельно друг от друга
CРесэмплировать только дни и считать CTR по дням
DРесэмплировать пользователей с возвращением в каждом варианте и каждый раз пересчитывать отношение сумм
Правильный ответ. В bootstrap нужно ресэмплировать на уровне единицы рандомизации и пересчитывать ratio metric как отношение сумм.

Разбор

Если рандомизация по пользователю, внутри пользователя наблюдения зависимы и это нужно сохранять. Поэтому в каждом бутстрап-репликате выбирают пользователей с возвращением, суммируют клики и показы по выбранным пользователям и считают CTR. Так получают эмпирическое распределение эффекта без жестких предположений о форме распределения.

Проверь себя · 1/3разбор после ответа
Вы сравниваете CTR на очень большом трафике; у каждого пользователя много показов, нулевых знаменателей почти нет. Какой метод обычно дает хороший баланс точности и скорости?
Тренировать A/B в Telegram

Ещё вопросы по теме «Ratio-метрики и бутстреп»