Аналитик построил гистограмму времени сессий, но результат выглядит неинформативно. Как ширина интервалов (bin width) влияет на полезность гистограммы?
AСлишком узкие интервалы сглаживают данные — теряются детали и модальность
BШирина интервала не влияет на вид гистограммы, меняется только высота столбцов
CСлишком широкие интервалы скрывают структуру, слишком узкие создают шум — нужен баланс
DОптимальная ширина всегда равна стандартному отклонению, делённому на число наблюдений
Правильный ответ. Слишком широкие интервалы усредняют данные и скрывают детали (мультимодальность, выбросы). Слишком узкие — показывают случайный шум вместо закономерностей.
Разбор
Выбор ширины интервала — ключевой шаг при построении гистограммы. Широкие интервалы (мало столбцов) «сглаживают» распределение: два пика могут слиться в один. Узкие интервалы (много столбцов) показывают каждое колебание, и закономерность теряется за шумом. Эвристики вроде правила Стёрджеса или Фридмана–Диакониса помогают найти баланс автоматически.
Проверь себя · 1/3разбор после ответа
Распределение доходов домохозяйств имеет положительную асимметрию. Как это выглядит на графике и как соотносятся среднее и медиана?
Ещё вопросы по теме «Описательная статистика»
- Для набора значений 2, 4, 6, 8 чему равно `mean`?
- Даны значения 1, 3, 7, 9, 10. Чему равна `median`?
- Для набора 1, 2, 2, 3, 3, 3, 4 чему равна `mode`?
- В отчёте о зарплатах есть редкие очень большие значения (`выбросы`). Какую меру центра обычно лучше использовать вместо `mean`, чтобы не исказить картину?
- Как обычно называют `quantile` уровня 0.25?
- Все вопросы по «Описательная статистика» →