На scatter plot видно два отчётливых облака точек, но общая correlation слабая. Какой следующий шаг чаще всего помогает понять природу этих облаков?
AПровести одну общую линейную
trend line и игнорировать облакаBПопробовать раскрасить точки через
color encoding по кандидатным признакам (канал, регион, тариф) или сделать faceting и сравнить внутри группCСделать оси логарифмическими, не проверяя необходимость
log scaleDСделать вывод, что связи нет, потому что
correlation низкаяПравильный ответ. Кластеры часто означают скрытый
segment; их стоит показать через color encoding или faceting.Разбор
Два облака могут соответствовать разным типам пользователей, тарифам или рынкам. Подсветка категорий и разбиение на панели помогает проверить гипотезу о сегментации и не смешивать разные режимы поведения в одном выводе.
Проверь себя · 1/3разбор после ответа
Какой график лучше всего подходит, чтобы показать связь между двумя числовыми переменными на уровне наблюдений (например
price и quantity)?Ещё вопросы по теме «Зависимости и scatter-графики»
- Какой график лучше всего подходит, чтобы показать связь между двумя числовыми переменными на уровне наблюдений (например `price` и `quantity`)?
- На `scatter plot` посчитана `correlation` r = -0.8 между X и Y. Что это означает?
- Вы увидели на `scatter plot` высокую `correlation` между числом уведомлений и churn. Какой вывод корректнее всего?
- В `scatter plot` с сотнями тысяч точек всё сливается в сплошное пятно (`overplotting`). Что сделать первым, чтобы увидеть структуру плотности?
- Когда добавление `trend line` на `scatter plot` обычно наиболее уместно?
- Все вопросы по «Зависимости и scatter-графики» →