На scatter plot зависимость выглядит U‑образной: при малых и больших X значения Y выше, а в середине ниже. При этом correlation близка к 0. Что корректнее всего сказать или сделать?
AРаз
correlation около 0, связи нет и график можно не анализироватьBНулевая
correlation не исключает нелинейной связи; стоит добавить нелинейную trend line (например loess (локальная взвешенная регрессия — кривая сглаживания)) или изменить представлениеCНужно обязательно применить
log scale, тогда correlation станет высокойDНужно удалить половину точек, чтобы получилась линейная зависимость
Правильный ответ.
correlation описывает линейность; нелинейная связь может существовать при значении около 0.Разбор
U‑образный рисунок — это связь, но не линейная, поэтому Pearson может давать около нуля. Нелинейная trend line или разбиение диапазона X помогает показать реальную форму зависимости.
Проверь себя · 1/3разбор после ответа
Вы хотите добавить третью числовую переменную в
scatter plot с большим числом точек, не скрывая плотность. Что обычно предпочтительнее?Ещё вопросы по теме «Зависимости и scatter-графики»
- Какой график лучше всего подходит, чтобы показать связь между двумя числовыми переменными на уровне наблюдений (например `price` и `quantity`)?
- На `scatter plot` посчитана `correlation` r = -0.8 между X и Y. Что это означает?
- Вы увидели на `scatter plot` высокую `correlation` между числом уведомлений и churn. Какой вывод корректнее всего?
- В `scatter plot` с сотнями тысяч точек всё сливается в сплошное пятно (`overplotting`). Что сделать первым, чтобы увидеть структуру плотности?
- Когда добавление `trend line` на `scatter plot` обычно наиболее уместно?
- Все вопросы по «Зависимости и scatter-графики» →