Когда log scale чаще всего полезна при визуализации распределения?
AКогда данные имеют сильную
skewness и значения различаются на порядкиBКогда все значения уже лежат в узком диапазоне
CКогда вы строите временной ряд и хотите убрать сезонность
DКогда нужно заменить
percentiles на среднееПравильный ответ.
log scale помогает, когда разброс огромный и есть длинные хвосты.Разбор
Логарифмическая шкала сжимает большие значения и раскрывает структуру в области малых значений. Это полезно для метрик с тяжелыми хвостами, например выручки или длительности. Но важно подписывать ось и помнить, что визуальные расстояния интерпретируются иначе.
Проверь себя · 1/3разбор после ответа
Нужно сравнить распределения метрики по 8 сегментам (страны). Какой график чаще всего компактнее и удобнее для сравнения разброса и
outliers?Ещё вопросы по теме «Распределения и выбросы»
- Что лучше всего показывает `histogram`?
- В `boxplot` «коробка» обычно соответствует какому диапазону `percentiles`?
- Как изменение `bin width` в `histogram` чаще всего влияет на восприятие данных?
- Что означает положительная `skewness` (правый перекос) у распределения выручки на пользователя?
- Вы видите единичные экстремальные значения в метрике времени ответа. Что разумнее всего сделать первым шагом перед удалением `outliers`?
- Все вопросы по «Распределения и выбросы» →