Question 1

Почему в `bootstrap` обычно пересэмплируют наблюдения именно с возвращением, а не без?

Accepted Answer

`Bootstrap` рассматривает выборку как приближение популяции и делает пересэмплирование с возвращением. С возвращением одно и то же наблюдение может появляться в реплике несколько раз, а какие-то наблюдения не появятся вовсе, что и создаёт вариативность статистики. Это похоже на идею повторных выборок из большой популяции, которую мы не видим напрямую. Типичная ошибка — пересэмплировать без возвращения и получать почти ту же выборку, из-за чего неопределённость будет занижена. Гарантированного снижения дисперсии `bootstrap` не даёт — он только оценивает её честнее.

Question 2

В классическом `bootstrap` какой размер обычно имеет каждая пересэмплированная выборка относительно исходной выборки размера `n`?

Accepted Answer

Обычно каждая `bootstrap`-выборка имеет размер `n` и содержит повторы наблюдений. Классический бутстрэп-ресэмплинг — это сэмплирование с возвращением размера `n` (того же, что у исходной выборки). Часть наблюдений в реплике повторяется, часть не попадает совсем. Размер `n` сохраняется, чтобы дисперсия статистики на бутстрэп-выборке имитировала её дисперсию на реальной выборке такого же объёма. Удвоение `n` искусственно занижает дисперсию и не имеет статистического обоснования. `n - 1` — это `jackknife` (`leave-one-out`), отдельный метод. Случайный размер в каждом повторе разрушает основное свойство ресэмплинга.

Question 3

Если `bootstrap`-распределение статистики заметно асимметрично, какой способ построения доверительного интервала чаще оказывается более уместным?

Accepted Answer

Процентильный интервал использует форму эмпирического распределения, а не предположение симметрии. При сильной асимметрии интервал estimate ± 1.96·SE может быть плохо калиброван и давать неинтуитивные границы. Процентильный интервал берёт квантили из `bootstrap`-реплик и лучше отражает форму распределения статистики. Перестановочный тест и интервал — это разные инструменты: тест проверяет гипотезу, а не строит границы. Отказ от интервала ради точечной оценки прячет реальную неопределённость.

Question 4

Вы увеличили число повторов `bootstrap` с 500 до 10000. Что изменится в первую очередь?

Accepted Answer

Больше повторов снижает шум симуляции, но не заменяет увеличение данных. Число повторов влияет на точность оценки квантилей и стандартной ошибки как результата симуляции: больше повторов — меньше случайного шума вычисления. Но сами данные не меняются, поэтому истинная неопределённость и возможное смещение остаются теми же. Типичная ошибка — путать увеличение числа повторов с ростом размера выборки `n`.

Question 5

В перестановочном тесте для разницы метрики между группами A и B что нужно сохранять при перестановках, чтобы тест был корректным?

Accepted Answer

В перестановочном тесте мы фиксируем данные и переставляем метки групп, сохраняя их размеры. Логика перестановочного теста — смоделировать, какие значения статистики возможны при `H0`, если метки групп не несут информации. Поэтому мы объединяем наблюдения, перемешиваем метки и заново делим на группы тех же размеров. Типичная ошибка — пересэмплировать с возвращением и получить уже другой тест, ближе к `bootstrap`.

Бутстреп и перестановочные тесты: вопросы для собеседования (часть 2)

Вопросы 6–10 из 20

Хотите тренировать интерактивно?

Другие темы: Статистика