Вы посчитали корреляцию между количеством новых пользователей и количеством тикетов в саппорт и получили 0.9, потому что оба ряда росли каждый месяц. Какое действие лучше всего снижает риск ложного вывода?

AУчитывать тренд: сравнить изменения по месяцам или контролировать время, чтобы убрать общий рост и проверить совместные колебания
BЗаменить коэффициент Pearson r на распределение Binomial(n,p) и пересчитать связь между метриками для очистки от общего тренда
CСчитать корреляцию только по последнему месяцу выборки и игнорировать остальные периоды, чтобы исключить накопленный временной эффект
DИгнорировать форму временных рядов: значение 0.9 всегда означает прямую причинно-следственную связь между двумя растущими метриками
Правильный ответ. Общий тренд может создавать ложные корреляции во временных рядах.

Разбор

Если две метрики растут со временем по внешним причинам, они будут коррелировать даже без реальной связи. Убирая тренд или контролируя время, вы проверяете, остаются ли совместные колебания поверх общего роста. Частая ошибка — интерпретировать трендовую корреляцию как прямое влияние одной метрики на другую.

Проверь себя · 1/3разбор после ответа
У вас миллион наблюдений, Pearson r между двумя метриками равен 0.03, а p-value очень маленький. Какой вывод наиболее корректен для продукта?
Тренировать статистику в Telegram

Ещё вопросы по теме «Корреляция и регрессия»