Вы видите единичные экстремальные значения в метрике времени ответа. Что разумнее всего сделать первым шагом перед удалением outliers?
AСразу удалить все
outliers, чтобы график выглядел красивоBПроверить, не являются ли
outliers реальными редкими случаями или ошибками логирования/единиц измеренияCЗаменить
histogram на bar chartDПосчитать только среднее и игнорировать распределение
Правильный ответ.
outliers могут быть и реальностью, и ошибкой — сначала диагностируйте причину.Разбор
Экстремальные значения могут отражать реальные сбои, пиковую нагрузку или редкие сценарии. Но они также могут появляться из-за ошибок единиц, таймзон или дубликатов. Перед удалением стоит проверить источники данных и контекст, а затем уже решать, как их учитывать в анализе.
Проверь себя · 1/3разбор после ответа
Если цель — показать хвост распределения времени ответа, какие
percentiles чаще всего полезно добавить к p50?Ещё вопросы по теме «Распределения и выбросы»
- Что лучше всего показывает `histogram`?
- В `boxplot` «коробка» обычно соответствует какому диапазону `percentiles`?
- Как изменение `bin width` в `histogram` чаще всего влияет на восприятие данных?
- Что означает положительная `skewness` (правый перекос) у распределения выручки на пользователя?
- Когда `log scale` чаще всего полезна при визуализации распределения?
- Все вопросы по «Распределения и выбросы» →