Вы видите положительную корреляцию между продажами мороженого и количеством утоплений по дням. Это типичный пример ложной связи. Что наиболее вероятно объясняет наблюдение?

AМороженое прямо вызывает утопления: повышение уровня сахара в крови у купающихся ослабляет их физическую форму на воде
BКорреляция Пирсона по дням посчитана с ошибкой и не работает на временных рядах с сезонностью и автокорреляцией
CЕсть смешивающий фактор (например, температура воздуха), который влияет и на продажи мороженого, и на число утоплений
DСвязь объясняется обратной причинностью: рост числа утоплений поднимает спрос на мороженое в курортных регионах летом
Правильный ответ. Ложная связь часто возникает из-за общего смешивающего фактора, который влияет на обе переменные.

Разбор

Это классический пример конфаундера: жаркие дни одновременно увеличивают и продажи мороженого, и число купающихся, а вместе с ними — количество утоплений. Между двумя метриками нет прямой причинной связи, обе следуют за температурой. Идея «мороженое вызывает утопления через сахар» физически несостоятельна. Тезис, что Пирсон не работает на временных рядах, верен лишь технически (нужны поправки на автокорреляцию), но не объясняет ложную связь. Обратная причинность (утопления влияют на спрос) маловероятна на масштабе данных.

Проверь себя · 1/3разбор после ответа
У вас миллион наблюдений, Pearson r между двумя метриками равен 0.03, а p-value очень маленький. Какой вывод наиболее корректен для продукта?
Тренировать статистику в Telegram

Ещё вопросы по теме «Корреляция и регрессия»