У вас 100 наблюдений, где почти нет связи между x и y, но есть одна точка с очень большим x и y. После добавления этой точки Pearson r стал 0.8. Что это чаще всего означает?

AЗначит, связь стала причинной
BЗначит, линейная регрессия точно описывает процесс
CPearson r чувствителен к выбросам, и один выброс мог исказить оценку correlation
DЗначит, данные стали бинарными
Правильный ответ. Один выброс может сильно изменить Pearson r.

Разбор

Pearson r зависит от ковариации и может резко вырасти из-за одной экстремальной точки. Поэтому полезно смотреть scatter plot и проверять устойчивость результата без выбросов. Типичная ловушка — принять выброс за закономерность и сделать сильный вывод про связь.

Проверь себя · 1/3разбор после ответа
Когда использование Pearson r наиболее уместно?
Тренировать статистику в Telegram

Ещё вопросы по теме «Корреляция и регрессия»