В scatter plot для двух переменных общий рисунок кажется без связи, но вы подозреваете, что разные сегменты ведут себя по-разному. Какой приём лучше всего помогает не смешивать сегменты?
AУвеличить толщину сетки на графике
BСпрятать легенду, чтобы не отвлекала
CПостроить один общий
trend line, чтобы он всё объяснилDРазделить данные по
segment через faceting или сделать color encoding по сегментуПравильный ответ. Смешение сегментов может скрыть связь; используйте
faceting или color encoding.Разбор
Когда сегменты имеют разные уровни или наклоны, общий график может выглядеть плоским. faceting и color encoding позволяют увидеть различия между группами и корректнее интерпретировать correlation внутри сегментов.
Проверь себя · 1/3разбор после ответа
Вы хотите добавить третью числовую переменную в
scatter plot с большим числом точек, не скрывая плотность. Что обычно предпочтительнее?Ещё вопросы по теме «Зависимости и scatter-графики»
- Какой график лучше всего подходит, чтобы показать связь между двумя числовыми переменными на уровне наблюдений (например `price` и `quantity`)?
- На `scatter plot` посчитана `correlation` r = -0.8 между X и Y. Что это означает?
- Вы увидели на `scatter plot` высокую `correlation` между числом уведомлений и churn. Какой вывод корректнее всего?
- В `scatter plot` с сотнями тысяч точек всё сливается в сплошное пятно (`overplotting`). Что сделать первым, чтобы увидеть структуру плотности?
- Когда добавление `trend line` на `scatter plot` обычно наиболее уместно?
- Все вопросы по «Зависимости и scatter-графики» →