Вы посчитали correlation между количеством новых пользователей и количеством тикетов в саппорт и получили 0.9, потому что оба ряда росли каждый месяц. Какое действие лучше всего снижает риск spurious вывода?

AЗаменить Pearson r на Binomial(n,p)
BСчитать correlation только по последнему месяцу
CУчитывать тренд: сравнить изменения (например, разности по месяцам) или контролировать время, чтобы убрать общий рост
DИгнорировать результат: 0.9 всегда означает сильную причинность
Правильный ответ. Общий тренд может создавать spurious корреляции во временных рядах.

Разбор

Если две метрики растут со временем по внешним причинам, они будут коррелировать даже без реальной связи. Убирая тренд или контролируя время, вы проверяете, остаются ли совместные колебания поверх общего роста. Частая ошибка — интерпретировать трендовую корреляцию как прямое влияние одной метрики на другую.

Проверь себя · 1/3разбор после ответа
В модели линейная регрессия вида revenue = a + b*emails коэффициент b равен 0.8. Как правильно интерпретировать b?
Тренировать статистику в Telegram

Ещё вопросы по теме «Корреляция и регрессия»