Вы видите положительную correlation между продажами мороженого и количеством утоплений по дням. Это типичный пример спуриозной (spurious) связи. Что наиболее вероятно объясняет наблюдение?
AМороженое вызывает утопления
BЕсть
confounding фактор (например, температура), который влияет и на мороженое, и на утопленияCОшибка в
Pearson r, он не работает по днямDЭто невозможно, потому что
correlation всегда означает причинностьПравильный ответ.
spurious связь часто возникает из-за общего фактора confounding.Разбор
Температура повышает и спрос на мороженое, и вероятность купания, что увеличивает утопления. Тогда две переменные выглядят связанными, хотя прямой причинной связи нет. Такой пример помогает помнить, что correlation без контекста может быть обманчивой.
Проверь себя · 1/3разбор после ответа
В модели
линейная регрессия вида revenue = a + b*emails коэффициент b равен 0.8. Как правильно интерпретировать b?Ещё вопросы по теме «Корреляция и регрессия»
- В отчете нашли положительную `correlation` между числом пушей на пользователя и выручкой. Какой вывод наиболее корректен?
- В данных по товарам `Pearson r` между ценой и конверсией равен -0.7. Как это интерпретировать?
- У вас 100 наблюдений, где почти нет связи между `x` и `y`, но есть одна точка с очень большим `x` и `y`. После добавления этой точки `Pearson r` стал 0.8. Что это чаще всего означает?
- Конверсия растет со скидкой до порога, а затем почти не меняется. При этом `Pearson r` между скидкой и конверсией близок к 0. Какой вывод корректен?
- Вы нашли `correlation` между количеством показов рекламы и выручкой. Но вы знаете, что в праздники и показы, и выручка растут. Как лучше описать риск интерпретации?
- Все вопросы по «Корреляция и регрессия» →