Для метрики с сильной асимметрией (тяжёлый правый хвост) какая характеристика чаще всего более устойчива к выбросам?
AСреднее значение, потому что оно использует все наблюдения и лучше отражает общую картину распределения
BМедиана и квантили (
p50, p90, p95), потому что они зависят от порядка значений, а не от величины хвостаCМаксимум, потому что он явно показывает крайние значения и помогает выявить редкие большие наблюдения
DРазмах (max − min), потому что он напрямую измеряет ширину распределения и устойчив к выбросам в данных
Правильный ответ. Медиана и квантили (
p50, p90) менее чувствительны к выбросам, чем среднее, потому что зависят от порядка значений.Разбор
Когда распределение асимметрично, редкие большие значения могут сильно сдвинуть среднее. Медиана и другие квантили (p90, p95) меняются меньше, потому что зависят от порядка наблюдений, а не от величины хвоста. Поэтому для отчётов по тяжёлым хвостам обычно показывают медиану и p90/p95 вместе со средним, чтобы дать полную картину.
Проверь себя · 1/3разбор после ответа
Если цель — показать хвост распределения времени ответа, какие перцентили чаще всего полезно добавить к
p50?Ещё вопросы по теме «Распределения и выбросы»
- Какую информацию о данных лучше всего показывает гистограмма?
- В диаграмме «ящик с усами» (`boxplot`) сама «коробка» обычно соответствует какому диапазону квантилей данных?
- Как изменение ширины бина в гистограмме чаще всего влияет на восприятие распределения данных?
- Что означает положительная асимметрия (правый перекос) у распределения выручки на пользователя?
- Вы видите единичные экстремальные значения в метрике времени ответа. Что разумнее всего сделать первым шагом перед удалением выбросов?
- Все вопросы по «Распределения и выбросы» →