Вы строите гистограмму по редкой метрике и видите «зубчатую» форму: много пустых бинов и несколько заполненных. Какой фактор наиболее вероятно приводит к этой картине?
AНеправильный выбор
boxplot вместо гистограммы автоматически создаёт зубчатую форму у любой метрикиBСлишком маленькая выборка или слишком мелкая ширина бина при текущем объёме данных приводят к рваной форме
CБольшая правая асимметрия распределения всегда делает гистограмму зубчатой при любом размере выборки
DЛогарифмическая шкала по оси Y обязательно исправит зубчатость без увеличения выборки и подбора бинов
Правильный ответ. При малом числе наблюдений и мелкой ширине бина гистограмма выглядит рвано из-за дискретности и шума.
Разбор
Если наблюдений мало, распределение по бинам получается нестабильным, и часть интервалов оказывается пустой просто из-за дискретности данных. Это нормальное следствие малой выборки, а не свойство процесса. Чтобы оценка формы стала устойчивее, можно увеличить ширину бина, объединить периоды или собрать больше данных. Логарифмическая шкала меняет восприятие, но сама по себе зубчатость не лечит, а асимметрия и неверный выбор графика тут ни при чём.
Проверь себя · 1/3разбор после ответа
Какую информацию о данных лучше всего показывает гистограмма?
Ещё вопросы по теме «Распределения и выбросы»
- Какую информацию о данных лучше всего показывает гистограмма?
- В диаграмме «ящик с усами» (`boxplot`) сама «коробка» обычно соответствует какому диапазону квантилей данных?
- Как изменение ширины бина в гистограмме чаще всего влияет на восприятие распределения данных?
- Что означает положительная асимметрия (правый перекос) у распределения выручки на пользователя?
- Вы видите единичные экстремальные значения в метрике времени ответа. Что разумнее всего сделать первым шагом перед удалением выбросов?
- Все вопросы по «Распределения и выбросы» →