На scatter plot видно два отчётливых облака точек, но общая correlation слабая. Какой следующий шаг чаще всего помогает понять природу этих облаков?

AПровести одну общую линейную trend line и игнорировать облака
BПопробовать раскрасить точки через color encoding по кандидатным признакам (канал, регион, тариф) или сделать faceting и сравнить внутри групп
CСделать оси логарифмическими, не проверяя необходимость log scale
DСделать вывод, что связи нет, потому что correlation низкая
Правильный ответ. Кластеры часто означают скрытый segment; их стоит показать через color encoding или faceting.

Разбор

Два облака могут соответствовать разным типам пользователей, тарифам или рынкам. Подсветка категорий и разбиение на панели помогает проверить гипотезу о сегментации и не смешивать разные режимы поведения в одном выводе.

Проверь себя · 1/3разбор после ответа
Какой график лучше всего подходит, чтобы показать связь между двумя числовыми переменными на уровне наблюдений (например price и quantity)?
Открыть Карьерник в Telegram

Ещё вопросы по теме «Зависимости и scatter-графики»