На диаграмме рассеяния для двух переменных общий рисунок кажется без связи, но вы подозреваете, что разные сегменты ведут себя по-разному. Какой приём лучше всего помогает не смешивать сегменты?
AУтолщить сетку графика и подписать оси крупнее, чтобы общий рисунок облака точек выглядел убедительнее
BСпрятать легенду и убрать названия осей: внимание зрителя сосредоточится на форме общего облака точек
CРазделить данные по сегменту на фасеты-подграфики или закодировать сегмент цветом точек на одном графике
DПостроить один общий тренд по всем точкам и опираться только на него как на самое простое объяснение
Правильный ответ. Смешение сегментов может скрыть связь; используйте фасетирование или кодирование цветом по сегменту.
Разбор
Когда сегменты имеют разные уровни или наклоны, общий график может выглядеть плоским из-за усреднения. Фасетирование и кодирование цветом позволяют увидеть различия между группами и корректнее интерпретировать связь внутри сегментов. Без такого разделения легко принять разнонаправленные тренды за отсутствие связи и сделать ошибочный вывод.
Проверь себя · 1/3разбор после ответа
Вы хотите добавить третью числовую переменную к диаграмме рассеяния (например, длительность сессии). Какое цветовое кодирование наиболее корректно?
Ещё вопросы по теме «Зависимости и scatter-графики»
- Какой график лучше всего подходит, чтобы показать связь между двумя числовыми переменными на уровне отдельных наблюдений (например, `price` и `quantity`)?
- На диаграмме рассеяния посчитан коэффициент корреляции r = -0.8 между X и Y. Что это означает?
- Вы увидели на диаграмме рассеяния высокую корреляцию между числом уведомлений и оттоком. Какой вывод корректнее всего?
- На точечной диаграмме с сотнями тысяч точек всё сливается в сплошное пятно из-за наложения. Что сделать первым, чтобы увидеть структуру плотности?
- Когда добавление линии тренда на точечную диаграмму обычно наиболее уместно?
- Все вопросы по «Зависимости и scatter-графики» →