Что означает положительная асимметрия (правый перекос) у распределения выручки на пользователя?
AБольшинство пользователей имеют очень большие значения выручки и распределение сосредоточено справа
BЕсть длинный правый хвост: редкие пользователи с очень большими значениями тянут среднее вверх
CРаспределение строго симметрично, среднее и медиана совпадают, а форма похожа на колокол
DДанные обязательно содержат ошибки или артефакты, которые надо очистить перед анализом
Правильный ответ. Положительная асимметрия обычно означает длинный правый хвост — редкие крупные значения тянут среднее.
Разбор
Для метрик вроде выручки часто характерны редкие крупные значения, которые тянут хвост вправо и поднимают среднее над медианой. Это влияет на среднее, делает медиану более устойчивой и часто заставляет применять логарифм перед визуализацией. Вывод о наличии ошибок делать нельзя без дополнительных проверок — правый перекос для выручки или времени между событиями совершенно естественен. Симметричное распределение — это противоположный случай, где средняя и медиана близки.
Проверь себя · 1/3разбор после ответа
Если цель — показать хвост распределения времени ответа, какие перцентили чаще всего полезно добавить к
p50?Ещё вопросы по теме «Распределения и выбросы»
- Какую информацию о данных лучше всего показывает гистограмма?
- В диаграмме «ящик с усами» (`boxplot`) сама «коробка» обычно соответствует какому диапазону квантилей данных?
- Как изменение ширины бина в гистограмме чаще всего влияет на восприятие распределения данных?
- Вы видите единичные экстремальные значения в метрике времени ответа. Что разумнее всего сделать первым шагом перед удалением выбросов?
- Когда логарифмическая шкала чаще всего полезна при визуализации распределения значений?
- Все вопросы по «Распределения и выбросы» →