На точечной диаграмме видно два отчётливых облака точек, но общая корреляция слабая. Какой следующий шаг чаще всего помогает понять природу этих облаков?

AПровести единую общую линию тренда через все точки и не учитывать видимое деление на облака на графике
BРаскрасить точки по кандидатным признакам (канал, регион, тариф) или сделать панели и сравнить связь внутри групп
CПеревести оси в логарифмический масштаб без проверки необходимости и распределения значений по осям
DСделать вывод об отсутствии связи на основании низкого общего коэффициента корреляции по всем точкам сразу
Правильный ответ. Кластеры на точечной диаграмме часто означают скрытый сегмент; их стоит показать через цветовое кодирование или разбиение на панели.

Разбор

Два облака могут соответствовать разным типам пользователей, тарифам или рынкам. Подсветка категорий и разбиение на панели помогает проверить гипотезу о сегментации и не смешивать разные режимы поведения в одном выводе. Общий коэффициент корреляции по смешанным группам часто маскирует сильную связь внутри каждой и приводит к неправильным выводам.

Проверь себя · 1/3разбор после ответа
Вы построили диаграмму рассеяния по дневным точкам и хотите показать, как связь менялась со временем, не превращая график в линию. Что можно сделать?
Открыть Карьерник в Telegram

Ещё вопросы по теме «Зависимости и scatter-графики»