Если bootstrap-распределение статистики заметно асимметрично, какой способ построения интервала чаще более уместен?
AПроцентильный интервал по квантилям эмпирического распределения
BИнтервал
estimate ± 1.96*SE без учёта формы распределенияCСчитать только одно число и отказаться от интервалов
DЗаменить интервал на
permutation test, потому что интервалы невозможныПравильный ответ. Процентильный интервал использует форму эмпирического распределения, а не предположение симметрии.
Разбор
При сильной асимметрии интервал вида estimate ± 1.96*SE может быть плохо калиброван и давать неинтуитивные границы. Процентильный интервал берёт квантили из bootstrap-реплик и лучше отражает форму распределения статистики. Типичная ошибка — взять неправильные квантили для нужного уровня, например перепутать границы двустороннего интервала.
Проверь себя · 1/3разбор после ответа
У вас есть
эмпирическое распределение статистики из bootstrap-реплик. Что из него можно получить напрямую?Ещё вопросы по теме «Бутстреп и перестановочные тесты»
- Что делает `bootstrap` на одном шаге, чтобы получить одну реплику статистики?
- Какая ключевая идея лежит в основе `permutation test` при проверке `H0` об отсутствии разницы между группами?
- Вы сделали 2000 повторов `bootstrap` для разницы средних A−B и получили 2000 значений разницы. Что из этого является `эмпирическое распределение` разницы средних?
- Как в `permutation test` обычно оценивают `p-value` для наблюдаемой статистики?
- Метрика имеет тяжёлые хвосты и сложную формулу (например, `revenue per user`). Какой подход часто удобен, чтобы оценить неопределённость оценки без сложных выводов формул?
- Все вопросы по «Бутстреп и перестановочные тесты» →