У вас 100 наблюдений, где почти нет связи между x и y, но есть одна точка с очень большим x и y. После добавления этой точки Pearson r стал 0.8. Что это чаще всего означает?
AЗначит, связь стала причинной
BЗначит,
линейная регрессия точно описывает процессC
Pearson r чувствителен к выбросам, и один выброс мог исказить оценку correlationDЗначит, данные стали бинарными
Правильный ответ. Один выброс может сильно изменить
Pearson r.Разбор
Pearson r зависит от ковариации и может резко вырасти из-за одной экстремальной точки. Поэтому полезно смотреть scatter plot и проверять устойчивость результата без выбросов. Типичная ловушка — принять выброс за закономерность и сделать сильный вывод про связь.
Проверь себя · 1/3разбор после ответа
Когда использование
Pearson r наиболее уместно?Ещё вопросы по теме «Корреляция и регрессия»
- В отчете нашли положительную `correlation` между числом пушей на пользователя и выручкой. Какой вывод наиболее корректен?
- В данных по товарам `Pearson r` между ценой и конверсией равен -0.7. Как это интерпретировать?
- Конверсия растет со скидкой до порога, а затем почти не меняется. При этом `Pearson r` между скидкой и конверсией близок к 0. Какой вывод корректен?
- Вы видите положительную `correlation` между продажами мороженого и количеством утоплений по дням. Это типичный пример спуриозной (`spurious`) связи. Что наиболее вероятно объясняет наблюдение?
- Вы нашли `correlation` между количеством показов рекламы и выручкой. Но вы знаете, что в праздники и показы, и выручка растут. Как лучше описать риск интерпретации?
- Все вопросы по «Корреляция и регрессия» →