Какой признак скорее говорит, что outliers — это ошибка данных, а не редкий реальный случай?

AЗначения превышают физически возможные пределы или имеют неправильные единицы (например, миллисекунды вместо секунд)
Boutliers встречаются только у платящих пользователей
Coutliers встречаются только в выходные
DРаспределение имеет правый хвост
Правильный ответ. Нарушение физических/логических ограничений часто указывает на ошибку данных.

Разбор

Если значение невозможно по смыслу метрики, это сильный сигнал проблем с качеством данных, например перепутанные единицы. Редкие реальные случаи обычно остаются в пределах возможного, даже если они экстремальны. Поэтому полезно иметь инварианты и проверки диапазонов для метрик.

Проверь себя · 1/3разбор после ответа
Вы сравниваете распределение выручки по двум когортам на histogram. Что важно сделать, чтобы сравнение было честным?
Открыть Карьерник в Telegram

Ещё вопросы по теме «Распределения и выбросы»