В отчёте по ARPU один пользователь совершил очень крупную покупку (выброс), и mean резко вырос. Что лучше всего сделать, чтобы донести картину честно и полезно для решения?
AПоказывать только
mean и не упоминать выбросBУдалить крупную покупку из данных без комментариев
CПоказывать только
std, без мер центра и без квантилейDПоказать
median и несколько quantile (например, 0.9), отдельно описать вклад выброса и как он влияет на meanПравильный ответ. При выбросах полезно дополнять
mean более устойчивыми метриками: median, quantile, IQR.Разбор
Mean может быть полезен, но при единичных крупных покупках он перестаёт отражать «типичного» пользователя. Median и quantile показывают центр и хвост без сильного влияния одной точки, а комментарий про выброс помогает правильно интерпретировать рост. Это особенно важно в продуктовых решениях: иначе можно переоценить эффект для большинства. Типичная ошибка — «чистить» данные без прозрачности и терять доверие к отчёту.
Проверь себя · 1/3разбор после ответа
Если все значения умножить на 3, как изменится
std?Ещё вопросы по теме «Описательная статистика»
- Для набора значений 2, 4, 6, 8 чему равно `mean`?
- Даны значения 1, 3, 7, 9, 10. Чему равна `median`?
- Для набора 1, 2, 2, 3, 3, 3, 4 чему равна `mode`?
- В отчёте о зарплатах есть редкие очень большие значения (`выбросы`). Какую меру центра обычно лучше использовать вместо `mean`, чтобы не исказить картину?
- Как обычно называют `quantile` уровня 0.25?
- Все вопросы по «Описательная статистика» →