Вы посчитали корреляцию между количеством новых пользователей и количеством тикетов в саппорт и получили 0.9, потому что оба ряда росли каждый месяц. Какое действие лучше всего снижает риск ложного вывода?
AУчитывать тренд: сравнить изменения по месяцам или контролировать время, чтобы убрать общий рост и проверить совместные колебания
BЗаменить коэффициент
Pearson r на распределение Binomial(n,p) и пересчитать связь между метриками для очистки от общего трендаCСчитать корреляцию только по последнему месяцу выборки и игнорировать остальные периоды, чтобы исключить накопленный временной эффект
DИгнорировать форму временных рядов: значение 0.9 всегда означает прямую причинно-следственную связь между двумя растущими метриками
Правильный ответ. Общий тренд может создавать ложные корреляции во временных рядах.
Разбор
Если две метрики растут со временем по внешним причинам, они будут коррелировать даже без реальной связи. Убирая тренд или контролируя время, вы проверяете, остаются ли совместные колебания поверх общего роста. Частая ошибка — интерпретировать трендовую корреляцию как прямое влияние одной метрики на другую.
Проверь себя · 1/3разбор после ответа
У вас миллион наблюдений,
Pearson r между двумя метриками равен 0.03, а p-value очень маленький. Какой вывод наиболее корректен для продукта?Ещё вопросы по теме «Корреляция и регрессия»
- В отчёте нашли положительную корреляцию между числом пушей на пользователя и выручкой. Какой вывод наиболее корректен?
- В данных по товарам коэффициент корреляции Пирсона между ценой и конверсией равен -0.7. Как это интерпретировать?
- У вас 100 наблюдений, где почти нет связи между `x` и `y`, но есть одна точка с очень большим `x` и `y`. После добавления этой точки `Pearson r` стал 0.8. Что это чаще всего означает?
- Конверсия растёт со скидкой до порога, а затем почти не меняется. При этом `Pearson r` между скидкой и конверсией близок к 0. Какой вывод корректен?
- Вы видите положительную корреляцию между продажами мороженого и количеством утоплений по дням. Это типичный пример ложной связи. Что наиболее вероятно объясняет наблюдение?
- Все вопросы по «Корреляция и регрессия» →