Вы построили histogram и видите два пика. Какой следующий шаг помогает понять, не является ли это артефактом bin width?
AСделать
bin width еще меньше, не глядя на результатBСменить
histogram на boxplot и забыть про пикиCПостроить
histogram с несколькими значениями bin width и проверить, сохраняются ли два пикаDСразу удалить
outliers, чтобы пики исчезлиПравильный ответ. Проверяйте форму распределения при разных
bin width, чтобы исключить артефакты биннинга.Разбор
Два пика могут быть реальной смесью подгрупп или результатом неудачного разбиения на бины. Построение нескольких histogram с разным bin width помогает понять, сохраняется ли бимодальность. Если структура устойчива, имеет смысл искать объяснение в сегментах данных.
Проверь себя · 1/3разбор после ответа
В
boxplot «коробка» обычно соответствует какому диапазону percentiles?Ещё вопросы по теме «Распределения и выбросы»
- Что лучше всего показывает `histogram`?
- В `boxplot` «коробка» обычно соответствует какому диапазону `percentiles`?
- Как изменение `bin width` в `histogram` чаще всего влияет на восприятие данных?
- Что означает положительная `skewness` (правый перекос) у распределения выручки на пользователя?
- Вы видите единичные экстремальные значения в метрике времени ответа. Что разумнее всего сделать первым шагом перед удалением `outliers`?
- Все вопросы по «Распределения и выбросы» →