Вы хотите добавить третью числовую переменную в scatter plot с большим числом точек, не скрывая плотность. Что обычно предпочтительнее?

AКодировать третью переменную только формой маркера, даже если значений много
BИспользовать color encoding для третьей переменной и оставить размер точек фиксированным
CСильно увеличить размер точек и кодировать переменную площадью пузыря
DПоменять scatter plot на bar chart, чтобы было проще
Правильный ответ. color encoding часто менее разрушительно для плотности, чем размер пузырей в перегруженном scatter plot.

Разбор

Большие пузыри перекрывают точки и усиливают overplotting, а восприятие площади неточно. Цветовой градиент с легендой позволяет показать третью величину и сохранить читаемость распределения.

Проверь себя · 1/3разбор после ответа
Если вы замените единицы X с метров на сантиметры (то есть умножите X на 100), что произойдёт с correlation между X и Y?
Открыть Карьерник в Telegram

Ещё вопросы по теме «Зависимости и scatter-графики»