Какая ошибка в bootstrap чаще всего приводит к некорректной оценке дисперсии для CTR?

AПересчитывать CTR в каждой реплике как отношение суммарных кликов к суммарным показам
BРесэмплировать пользователей с возвращением в каждом варианте
CРесэмплировать числитель и знаменатель отдельно, как независимые выборки
DФиксировать seed для воспроизводимости вычислений
Правильный ответ. Нельзя бутстрапить числитель и знаменатель отдельно, если они статистически зависимы.

Разбор

Клики и показы обычно связаны: больше показов часто означает больше возможностей для кликов. Если бутстрапить их независимо, вы разрушаете зависимость и можете занизить дисперсию эффекта. Правильнее ресэмплировать исходные наблюдения на уровне единицы рандомизации и пересчитывать ratio metric целиком.

Проверь себя · 1/3разбор после ответа
Почему анализ ratio metric вроде CTR часто нельзя делать как «обычный средний показатель» без оговорок?
Тренировать A/B в Telegram

Ещё вопросы по теме «Ratio-метрики и бутстреп»