В метрике дохода есть редкие огромные значения (выбросы). Вам нужна стабильная точечная оценка 'типичного' пользователя для мониторинга эффекта pricing. Какое решение наиболее разумно?

AВсегда использовать обычное среднее, потому что оно обязательно несмещённое
BУдалить все большие значения вручную без фиксированного правила, чтобы 'не мешали'
CВсегда использовать MLE, не анализируя распределение данных
DИспользовать робастную оценку (например, медиану или усечённое среднее) и понимать, что возможен небольшой bias, но меньше variance и выше устойчивость к выбросам
Правильный ответ. Робастная оценка может снизить шум (variance) и сделать мониторинг устойчивее, даже ценой небольшого bias.

Разбор

При тяжёлых хвостах среднее сильно зависит от редких экстремальных значений, поэтому variance метрики растёт и выводы становятся нестабильными. Медиана или усечённое среднее уменьшают влияние выбросов и часто полезны для операционного мониторинга pricing. Важно заранее определить правило и применять его последовательно, иначе появляется риск подгонки. Ошибка — считать, что робастный метод всегда лучше: иногда бизнес-цель требует именно среднего дохода, а не 'типичного'.

Проверь себя · 1/3разбор после ответа
Что верно про связь свойств несмещённость и состоятельность?
Тренировать статистику в Telegram

Ещё вопросы по теме «Точечные оценки и MLE»