На scatter plot переменная X имеет сильную асимметрию (значения от 1 до 1 000 000), а связь выглядит мультипликативной. Что чаще всего улучшит читаемость?

AОбрезать ось X до 1000, чтобы убрать большие значения
BСделать ось X категориальной по квантилям, чтобы было меньше точек
CИспользовать log scale для X (и при необходимости для Y)
DИнвертировать ось X, чтобы большие значения были слева
Правильный ответ. log scale помогает, когда важны относительные изменения и диапазон значений огромный.

Разбор

На log scale равные шаги соответствуют умножению, поэтому мультипликативные зависимости становятся ближе к линейным и лучше видны. Обрезка оси часто скрывает важные точки и может исказить выводы.

Проверь себя · 1/3разбор после ответа
Вы хотите добавить третью числовую переменную к scatter plot (например session_length). Какое color encoding наиболее корректно?
Открыть Карьерник в Telegram

Ещё вопросы по теме «Зависимости и scatter-графики»