Что делает bootstrap на одном шаге, чтобы получить одну реплику статистики?
AБерёт выборку того же размера
n с возвращением и пересчитывает статистикуBПеремешивает метки групп A/B и пересчитывает статистику
CДобавляет синтетические наблюдения, чтобы увеличить выборку
DУдаляет выбросы и пересчитывает среднее на очищенных данных
Правильный ответ. В
bootstrap мы много раз пересэмплируем данные с возвращением и пересчитываем статистику.Разбор
Каждая bootstrap-реплика — это новая выборка размера n, собранная из исходных наблюдений с повторениями. Повторяя это много раз, мы получаем эмпирическое распределение статистики и можем оценивать неопределённость. Типичная ошибка — перепутать bootstrap с permutation test, где переставляют метки, а не пересэмплируют наблюдения.
Проверь себя · 1/3разбор после ответа
В отчёте вам нужно: (a) 95% интервал для медианы времени доставки, (b)
p-value для H0, что две группы одинаковы по среднему времени доставки. Какое сочетание методов наиболее уместно?Ещё вопросы по теме «Бутстреп и перестановочные тесты»
- Какая ключевая идея лежит в основе `permutation test` при проверке `H0` об отсутствии разницы между группами?
- Вы сделали 2000 повторов `bootstrap` для разницы средних A−B и получили 2000 значений разницы. Что из этого является `эмпирическое распределение` разницы средних?
- Как в `permutation test` обычно оценивают `p-value` для наблюдаемой статистики?
- Метрика имеет тяжёлые хвосты и сложную формулу (например, `revenue per user`). Какой подход часто удобен, чтобы оценить неопределённость оценки без сложных выводов формул?
- Какое утверждение про ограничения `bootstrap` наиболее корректно?
- Все вопросы по «Бутстреп и перестановочные тесты» →