На диаграмме рассеяния зависимость выглядит U-образной: при малых и больших X значения Y выше, а в середине ниже. При этом корреляция Пирсона близка к 0. Что корректнее всего сказать или сделать?
AРаз корреляция около
0, связи нет: график можно не анализировать дальше, статистика показывает отсутствие зависимостиBПрименить логарифмическую шкалу по обеим осям: после этого корреляция Пирсона вырастет, а форма зависимости станет видна
CУдалить половину точек из середины диапазона X для получения линейной зависимости и роста коэффициента корреляции
DНулевая корреляция не исключает нелинейной связи: добавить нелинейную линию тренда (например
loess) или сменить видПравильный ответ. Корреляция Пирсона описывает линейную связь; нелинейная зависимость может существовать при значении около 0.
Разбор
U-образный рисунок — это связь, но не линейная, поэтому коэффициент Пирсона может давать около нуля. Нелинейная линия тренда (например loess) или разбиение диапазона X на интервалы помогает показать реальную форму зависимости. Логарифмирование осей и удаление точек не «починят» нелинейность — это лишь искажает данные. Правильный шаг — выбрать инструмент, подходящий именно для нелинейной зависимости.
Проверь себя · 1/3разбор после ответа
На диаграмме рассеяния переменная X имеет сильную асимметрию (значения от 1 до 1 000 000), а связь выглядит мультипликативной. Что чаще всего улучшит читаемость?
Ещё вопросы по теме «Зависимости и scatter-графики»
- Какой график лучше всего подходит, чтобы показать связь между двумя числовыми переменными на уровне отдельных наблюдений (например, `price` и `quantity`)?
- На диаграмме рассеяния посчитан коэффициент корреляции r = -0.8 между X и Y. Что это означает?
- Вы увидели на диаграмме рассеяния высокую корреляцию между числом уведомлений и оттоком. Какой вывод корректнее всего?
- На точечной диаграмме с сотнями тысяч точек всё сливается в сплошное пятно из-за наложения. Что сделать первым, чтобы увидеть структуру плотности?
- Когда добавление линии тренда на точечную диаграмму обычно наиболее уместно?
- Все вопросы по «Зависимости и scatter-графики» →