Какое утверждение корректно сравнивает correlation и линейная регрессия?
A
correlation всегда больше по модулю, чем коэффициент регрессииB
линейная регрессия симметрична: поменяйте x и y местами, получите тот же результатC
correlation симметрична по x и y, а линейная регрессия зависит от того, что вы предсказываете как y и что берете как xD
correlation применима только к бинарным даннымПравильный ответ.
correlation симметрична, а регрессия задает направление предсказания.Разбор
Корреляция не различает роли переменных: correlation(x,y) = correlation(y,x). В линейная регрессия вы минимизируете ошибки предсказания y по x, поэтому при перестановке ролей получите другую модель. Это важно для корректной постановки вопроса: предсказывать или объяснять.
Проверь себя · 1/3разбор после ответа
Вы подозреваете, что связь между числом пушей и оттоком объясняется тем, что пуши чаще получают новички. Что лучше сделать, чтобы снизить влияние
confounding в анализе?Ещё вопросы по теме «Корреляция и регрессия»
- В отчете нашли положительную `correlation` между числом пушей на пользователя и выручкой. Какой вывод наиболее корректен?
- В данных по товарам `Pearson r` между ценой и конверсией равен -0.7. Как это интерпретировать?
- У вас 100 наблюдений, где почти нет связи между `x` и `y`, но есть одна точка с очень большим `x` и `y`. После добавления этой точки `Pearson r` стал 0.8. Что это чаще всего означает?
- Конверсия растет со скидкой до порога, а затем почти не меняется. При этом `Pearson r` между скидкой и конверсией близок к 0. Какой вывод корректен?
- Вы видите положительную `correlation` между продажами мороженого и количеством утоплений по дням. Это типичный пример спуриозной (`spurious`) связи. Что наиболее вероятно объясняет наблюдение?
- Все вопросы по «Корреляция и регрессия» →