Метрика имеет тяжёлые хвосты и сложную формулу (например, revenue per user). Какой подход часто удобен, чтобы оценить неопределённость оценки без сложных выводов формул?

AВсегда считать, что данные нормальные, и игнорировать форму распределения
BИспользовать bootstrap, построив эмпирическое распределение статистики из данных
CИспользовать только permutation test, потому что интервалы не нужны
DУвеличить alpha, чтобы быстрее получать значимость
Правильный ответ. Bootstrap полезен, когда формулы для ошибки и интервала неочевидны, а метрика сложная.

Разбор

Идея bootstrap — получить эмпирическое распределение статистики напрямую из данных через ресэмплинг. Это позволяет оценивать стандартную ошибку и строить доверительные интервалы для сложных метрик. Типичная ошибка — думать, что bootstrap исправляет качество данных; он оценивает неопределённость относительно текущей выборки.

Проверь себя · 1/3разбор после ответа
Метрика имеет тяжёлые хвосты и сложную формулу (например, revenue per user). Какой подход часто удобен, чтобы оценить неопределённость оценки без сложных выводов формул?
Тренировать статистику в Telegram

Ещё вопросы по теме «Бутстреп и перестановочные тесты»