Какая ошибка в `bootstrap` чаще всего приводит к некорректной оценке дисперсии для `CTR`?

Question

Карьерник · Accepted Answer

Правильный ответ: Ресэмплировать числитель и знаменатель отдельно как независимые выборки, что разрушает корреляцию кликов и показов. Нельзя бутстрапить числитель и знаменатель отдельно, если они статистически зависимы — это занижает дисперсию. Клики и показы обычно связаны: больше показов часто означает больше возможностей для кликов. Если бутстрапить их независимо, вы разрушаете эту зависимость и можете занизить дисперсию эффекта. Правильнее ресэмплировать исходные наблюдения на уровне единицы рандомизации (пользователя) и пересчитывать ratio-метрику целиком на каждой реплике. Фиксация `seed` важна для воспроизводимости, но к смещению дисперсии она не приводит.

Какая ошибка в `bootstrap` чаще всего приводит к некорректной оценке дисперсии для `CTR`?

Разбор

Ещё вопросы по теме «Ratio-метрики и бутстреп»

Какая ошибка в bootstrap чаще всего приводит к некорректной оценке дисперсии для CTR?

Разбор

Ещё вопросы по теме «Ratio-метрики и бутстреп»

Какая ошибка в `bootstrap` чаще всего приводит к некорректной оценке дисперсии для `CTR`?