В классическом bootstrap какой размер обычно имеет каждая пересэмплированная выборка относительно исходной выборки размера n?
AТот же размер
n, но с возможными повторами наблюденийBВ два раза больше
n, чтобы снизить дисперсиюCНа 1 меньше
n, чтобы имитировать leave-one-outDСлучайный размер в каждом повторе, чтобы избежать смещения
Правильный ответ. Обычно каждая
bootstrap-выборка имеет размер n и содержит повторы.Разбор
Так сохраняется сопоставимость статистики между исходными данными и репликами: мы всегда считаем её на выборке одного масштаба. Повторы и пропуски отдельных наблюдений создают вариативность, из которой строят эмпирическое распределение статистики. Типичная ошибка — менять размер выборки без понимания, как это влияет на интерпретацию интервала и SE.
Проверь себя · 1/3разбор после ответа
В A/B-тесте группы сформированы случайно, а распределение метрики далеко от нормального. Вам нужен
p-value для H0: разницы нет. Что наиболее естественно использовать?Ещё вопросы по теме «Бутстреп и перестановочные тесты»
- Что делает `bootstrap` на одном шаге, чтобы получить одну реплику статистики?
- Какая ключевая идея лежит в основе `permutation test` при проверке `H0` об отсутствии разницы между группами?
- Вы сделали 2000 повторов `bootstrap` для разницы средних A−B и получили 2000 значений разницы. Что из этого является `эмпирическое распределение` разницы средних?
- Как в `permutation test` обычно оценивают `p-value` для наблюдаемой статистики?
- Метрика имеет тяжёлые хвосты и сложную формулу (например, `revenue per user`). Какой подход часто удобен, чтобы оценить неопределённость оценки без сложных выводов формул?
- Все вопросы по «Бутстреп и перестановочные тесты» →