В scatter plot с сотнями тысяч точек всё сливается в сплошное пятно (overplotting). Что сделать первым, чтобы увидеть структуру плотности?
AУвеличить размер маркеров, чтобы точки были заметнее
BУбрать подписи осей, чтобы освободить место
CПоменять местами оси X и Y, чтобы точки разошлись
DСделать точки полупрозрачными, уменьшив
alphaПравильный ответ. При
overplotting помогает прозрачность (alpha) и приёмы отображения плотности.Разбор
Уменьшение alpha позволяет видеть области высокой и низкой плотности, даже если точки перекрываются. Это простой первый шаг перед более тяжёлыми приёмами вроде биннинга или faceting.
Проверь себя · 1/3разбор после ответа
Вы хотите добавить третью числовую переменную к
scatter plot (например session_length). Какое color encoding наиболее корректно?Ещё вопросы по теме «Зависимости и scatter-графики»
- Какой график лучше всего подходит, чтобы показать связь между двумя числовыми переменными на уровне наблюдений (например `price` и `quantity`)?
- На `scatter plot` посчитана `correlation` r = -0.8 между X и Y. Что это означает?
- Вы увидели на `scatter plot` высокую `correlation` между числом уведомлений и churn. Какой вывод корректнее всего?
- Когда добавление `trend line` на `scatter plot` обычно наиболее уместно?
- На `scatter plot` переменная X имеет сильную асимметрию (значения от 1 до 1 000 000), а связь выглядит мультипликативной. Что чаще всего улучшит читаемость?
- Все вопросы по «Зависимости и scatter-графики» →