Какой технический нюанс важно учесть при использовании логарифмической шкалы для метрики, у которой бывают нули?
AЛогарифм нуля не определён, поэтому нужна трансформация (
log1p) или отдельный показ доли нулейBЛогарифмическая шкала автоматически заменяет нули на среднее по выборке и сглаживает распределение
CНули превращаются в выбросы и сильно искажают форму распределения на логарифмической шкале
DЛогарифмическая шкала корректно работает только с целыми числами, дробные значения ломают визуализацию
Правильный ответ. На логарифмической шкале значение 0 не определено, поэтому нули нужно явно обработать.
Разбор
Логарифм нуля не определён, поэтому прямое применение логарифмической шкалы ломает визуализацию. Обычно используют сдвиг (например, log1p) или отдельно показывают долю нулей. Утверждения про автоматическую замену нулей средним и про работу только с целыми числами неверны. Важно описать выбранный подход, чтобы не исказить интерпретацию распределения.
Проверь себя · 1/3разбор после ответа
Для метрики с сильной асимметрией (тяжёлый правый хвост) какая характеристика чаще всего более устойчива к выбросам?
Ещё вопросы по теме «Распределения и выбросы»
- Какую информацию о данных лучше всего показывает гистограмма?
- В диаграмме «ящик с усами» (`boxplot`) сама «коробка» обычно соответствует какому диапазону квантилей данных?
- Как изменение ширины бина в гистограмме чаще всего влияет на восприятие распределения данных?
- Что означает положительная асимметрия (правый перекос) у распределения выручки на пользователя?
- Вы видите единичные экстремальные значения в метрике времени ответа. Что разумнее всего сделать первым шагом перед удалением выбросов?
- Все вопросы по «Распределения и выбросы» →