Какой график лучше всего подходит, чтобы показать связь между двумя числовыми переменными на уровне наблюдений (например price и quantity)?
A
scatter plot (каждый заказ — точка)B
bar chart со средними по категориямC
pie chart по долям категорийD
histogram по распределению priceПравильный ответ. Для двух числовых переменных базовый выбор —
scatter plot.Разбор
scatter plot показывает пары значений и позволяет увидеть форму связи, кластеры и выбросы. Другие графики либо агрегируют данные, либо показывают распределение одной переменной, а не отношения.
Проверь себя · 1/3разбор после ответа
В
scatter plot для двух переменных общий рисунок кажется без связи, но вы подозреваете, что разные сегменты ведут себя по-разному. Какой приём лучше всего помогает не смешивать сегменты?Ещё вопросы по теме «Зависимости и scatter-графики»
- На `scatter plot` посчитана `correlation` r = -0.8 между X и Y. Что это означает?
- Вы увидели на `scatter plot` высокую `correlation` между числом уведомлений и churn. Какой вывод корректнее всего?
- В `scatter plot` с сотнями тысяч точек всё сливается в сплошное пятно (`overplotting`). Что сделать первым, чтобы увидеть структуру плотности?
- Когда добавление `trend line` на `scatter plot` обычно наиболее уместно?
- На `scatter plot` переменная X имеет сильную асимметрию (значения от 1 до 1 000 000), а связь выглядит мультипликативной. Что чаще всего улучшит читаемость?
- Все вопросы по «Зависимости и scatter-графики» →