Как изменение ширины бина в гистограмме чаще всего влияет на восприятие распределения данных?
AНа форму распределения ширина бина не влияет: меняется только цветовая заливка столбцов и подписи осей графика
BМалая ширина бина усиливает локальные пики и шум, а большая сглаживает форму и скрывает мелкие структуры
CБольшая ширина бина делает распределение симметричным и убирает асимметрию хвостов исходных данных метрики
DШирина бина влияет на положение среднего значения метрики, но визуально на форме гистограммы не отражается
Правильный ответ. Ширина бина управляет детализацией: слишком мелко — шум, слишком крупно — сглаживание формы.
Разбор
При малой ширине бина видно больше деталей, но вместе с этим возрастает визуальный шум и появляются «лишние» пики. При большой ширине форма сглаживается и мелкие структуры могут исчезнуть. Поэтому биннинг подбирают осознанно и проверяют устойчивость выводов при разных значениях. Утверждения про «не влияет», «всегда симметрично» или «только на среднее» — типичные мифы.
Проверь себя · 1/3разбор после ответа
Нужно сравнить распределения метрики по 8 сегментам (страны). Какой график чаще всего компактнее и удобнее для сравнения разброса и выбросов?
Ещё вопросы по теме «Распределения и выбросы»
- Какую информацию о данных лучше всего показывает гистограмма?
- В диаграмме «ящик с усами» (`boxplot`) сама «коробка» обычно соответствует какому диапазону квантилей данных?
- Что означает положительная асимметрия (правый перекос) у распределения выручки на пользователя?
- Вы видите единичные экстремальные значения в метрике времени ответа. Что разумнее всего сделать первым шагом перед удалением выбросов?
- Когда логарифмическая шкала чаще всего полезна при визуализации распределения значений?
- Все вопросы по «Распределения и выбросы» →