Метрика имеет тяжёлые хвосты и сложную формулу (например, выручка на пользователя). Какой подход часто удобен, чтобы оценить неопределённость оценки без сложных выводов формул?

Question

Карьерник · Accepted Answer

Правильный ответ: Использовать `bootstrap`: построить эмпирическое распределение статистики из данных через ресэмплинг и оценить стандартную ошибку и доверительный интервал. `Bootstrap` полезен, когда формулы для ошибки и интервала неочевидны, а метрика сложная. Идея `bootstrap` — получить эмпирическое распределение статистики напрямую из данных через ресэмплинг с возвращением. Это позволяет оценивать стандартную ошибку и строить доверительные интервалы для сложных метрик. Типичная ошибка — думать, что `bootstrap` исправляет качество данных; он оценивает неопределённость относительно текущей выборки.

Разбор

Ещё вопросы по теме «Бутстреп и перестановочные тесты»