На scatter plot зависимость выглядит U‑образной: при малых и больших X значения Y выше, а в середине ниже. При этом correlation близка к 0. Что корректнее всего сказать или сделать?

AРаз correlation около 0, связи нет и график можно не анализировать
BНулевая correlation не исключает нелинейной связи; стоит добавить нелинейную trend line (например loess (локальная взвешенная регрессия — кривая сглаживания)) или изменить представление
CНужно обязательно применить log scale, тогда correlation станет высокой
DНужно удалить половину точек, чтобы получилась линейная зависимость
Правильный ответ. correlation описывает линейность; нелинейная связь может существовать при значении около 0.

Разбор

U‑образный рисунок — это связь, но не линейная, поэтому Pearson может давать около нуля. Нелинейная trend line или разбиение диапазона X помогает показать реальную форму зависимости.

Проверь себя · 1/3разбор после ответа
Вы хотите добавить третью числовую переменную в scatter plot с большим числом точек, не скрывая плотность. Что обычно предпочтительнее?
Открыть Карьерник в Telegram

Ещё вопросы по теме «Зависимости и scatter-графики»