На диаграмме рассеяния зависимость выглядит U-образной: при малых и больших X значения Y выше, а в середине ниже. При этом корреляция Пирсона близка к 0. Что корректнее всего сказать или сделать?

AРаз корреляция около 0, связи нет: график можно не анализировать дальше, статистика показывает отсутствие зависимости
BПрименить логарифмическую шкалу по обеим осям: после этого корреляция Пирсона вырастет, а форма зависимости станет видна
CУдалить половину точек из середины диапазона X для получения линейной зависимости и роста коэффициента корреляции
DНулевая корреляция не исключает нелинейной связи: добавить нелинейную линию тренда (например loess) или сменить вид
Правильный ответ. Корреляция Пирсона описывает линейную связь; нелинейная зависимость может существовать при значении около 0.

Разбор

U-образный рисунок — это связь, но не линейная, поэтому коэффициент Пирсона может давать около нуля. Нелинейная линия тренда (например loess) или разбиение диапазона X на интервалы помогает показать реальную форму зависимости. Логарифмирование осей и удаление точек не «починят» нелинейность — это лишь искажает данные. Правильный шаг — выбрать инструмент, подходящий именно для нелинейной зависимости.

Проверь себя · 1/3разбор после ответа
На диаграмме рассеяния переменная X имеет сильную асимметрию (значения от 1 до 1 000 000), а связь выглядит мультипликативной. Что чаще всего улучшит читаемость?
Открыть Карьерник в Telegram

Ещё вопросы по теме «Зависимости и scatter-графики»