У вас есть эмпирическое распределение статистики из bootstrap-реплик. Что из него можно получить напрямую?
AСтандартную ошибку и доверительный интервал, например по квантилям распределения
BИстинную причинную связь между изменением и метрикой
CТочный размер всей популяции пользователей
DГарантированно несмещённую оценку для любой выборки
Правильный ответ.
Эмпирическое распределение статистики из bootstrap позволяет оценивать неопределённость оценки.Разбор
Стандартную ошибку можно оценить как стандартное отклонение bootstrap-реплик, а интервалы — как квантили (например, 2.5% и 97.5%). Это практичный способ, когда аналитические формулы неудобны. Типичная ошибка — пытаться трактовать bootstrap как инструмент причинности или исправления нерепрезентативности.
Проверь себя · 1/3разбор после ответа
У каждого пользователя много событий, и события внутри пользователя коррелированы. Вы хотите оценить неопределённость метрики на уровне пользователя через
bootstrap. Что корректнее пересэмплировать?Ещё вопросы по теме «Бутстреп и перестановочные тесты»
- Что делает `bootstrap` на одном шаге, чтобы получить одну реплику статистики?
- Какая ключевая идея лежит в основе `permutation test` при проверке `H0` об отсутствии разницы между группами?
- Вы сделали 2000 повторов `bootstrap` для разницы средних A−B и получили 2000 значений разницы. Что из этого является `эмпирическое распределение` разницы средних?
- Как в `permutation test` обычно оценивают `p-value` для наблюдаемой статистики?
- Метрика имеет тяжёлые хвосты и сложную формулу (например, `revenue per user`). Какой подход часто удобен, чтобы оценить неопределённость оценки без сложных выводов формул?
- Все вопросы по «Бутстреп и перестановочные тесты» →