Какое утверждение про ограничения bootstrap наиболее корректно?
A
Bootstrap гарантирует причинный вывод так же, как рандомизированный экспериментB
Bootstrap увеличивает реальный размер выборки, поэтому смещение исчезаетC
Bootstrap не исправляет selection bias и систематические ошибки: он лишь оценивает неопределённость относительно имеющихся данныхD
Bootstrap делает данные независимыми, поэтому подходит для любых временных рядов без оговорокПравильный ответ. Ресэмплинг оценивает вариативность, но не исправляет систематические ошибки данных.
Разбор
Bootstrap переиспользует те же наблюдения, поэтому не может добавить недостающие группы и не лечит смещение выборки. Если данные собраны с ошибкой или выборка нерепрезентативна, интервал будет аккуратно описывать неопределённость вокруг неправильной оценки. Типичная ошибка — пытаться компенсировать смещение, увеличивая число bootstrap повторов вместо улучшения данных или дизайна исследования.
Проверь себя · 1/3разбор после ответа
В A/B-тесте группы сформированы случайно, а распределение метрики далеко от нормального. Вам нужен
p-value для H0: разницы нет. Что наиболее естественно использовать?Ещё вопросы по теме «Бутстреп и перестановочные тесты»
- Что делает `bootstrap` на одном шаге, чтобы получить одну реплику статистики?
- Какая ключевая идея лежит в основе `permutation test` при проверке `H0` об отсутствии разницы между группами?
- Вы сделали 2000 повторов `bootstrap` для разницы средних A−B и получили 2000 значений разницы. Что из этого является `эмпирическое распределение` разницы средних?
- Как в `permutation test` обычно оценивают `p-value` для наблюдаемой статистики?
- Метрика имеет тяжёлые хвосты и сложную формулу (например, `revenue per user`). Какой подход часто удобен, чтобы оценить неопределённость оценки без сложных выводов формул?
- Все вопросы по «Бутстреп и перестановочные тесты» →