В scatter plot переменная X принимает только целые значения (например оценки 1–5), поэтому точки ложатся в вертикальные столбцы и перекрываются. Что поможет уменьшить overplotting и показать частоты?

AДобавить jitter (случайное смещение точек для устранения наложения) по X (небольшое случайное смещение) или использовать beeswarm (расстановка точек без перекрытия)-подобное расположение
BЗаменить scatter plot на bar chart с подсчётом точек в каждой категории — это покажет частоты, хотя потеряет распределение внутри групп.
CУменьшить размер точек до минимума и добавить trend line — мелкие точки меньше перекрываются, а линия тренда покажет общую закономерность.
DСжать диапазон оси X и увеличить масштаб графика — при большем разрешении точки визуально расходятся и наложение становится менее заметным.
Правильный ответ. jitter (случайное смещение точек для устранения наложения) помогает разнести совпадающие значения и увидеть плотность при дискретных осях.

Разбор

Когда значения повторяются, точки накладываются и скрывают количество наблюдений. jitter (случайное смещение точек для устранения наложения) добавляет малое смещение и делает видимыми слои точек, не меняя общий смысл графика.

Проверь себя · 1/3разбор после ответа
Какой график лучше всего подходит, чтобы показать связь между двумя числовыми переменными на уровне наблюдений (например price и quantity)?
Открыть Карьерник в Telegram

Ещё вопросы по теме «Зависимости и scatter-графики»