В данных по товарам коэффициент корреляции Пирсона между ценой и конверсией равен -0.7. Как это интерпретировать?
AСильная положительная линейная связь: при росте цены конверсия в товарах тоже растёт по линейному тренду в выборке наблюдений
BДостаточно сильная отрицательная линейная связь: при большей цене конверсия в товарах в среднем оказывается ниже по выборке
CСвязи между ценой и конверсией нет, поскольку коэффициент Пирсона по модулю меньше единицы в исследуемых данных каталога
DЦена причинно снижает конверсию на 70 процентов в среднем по всем товарам выборки в рассматриваемый период наблюдения
Правильный ответ. Коэффициент Пирсона описывает направление и силу линейной связи, но не причинность.
Разбор
Знак коэффициента Пирсона показывает направление: при отрицательном значении одна величина обычно растёт, когда другая падает. Модуль около 0.7 часто трактуют как заметную линейную связь в данных. При этом коэффициент Пирсона не доказывает, что цена является причиной изменения конверсии. Положительная связь противоречит знаку; «связи нет» — миф (нужно сравнивать с нулём, а не с единицей); проценты в причинном смысле — подмена величины коэффициента эффектом.
Проверь себя · 1/3разбор после ответа
У вас миллион наблюдений,
Pearson r между двумя метриками равен 0.03, а p-value очень маленький. Какой вывод наиболее корректен для продукта?Ещё вопросы по теме «Корреляция и регрессия»
- В отчёте нашли положительную корреляцию между числом пушей на пользователя и выручкой. Какой вывод наиболее корректен?
- У вас 100 наблюдений, где почти нет связи между `x` и `y`, но есть одна точка с очень большим `x` и `y`. После добавления этой точки `Pearson r` стал 0.8. Что это чаще всего означает?
- Конверсия растёт со скидкой до порога, а затем почти не меняется. При этом `Pearson r` между скидкой и конверсией близок к 0. Какой вывод корректен?
- Вы видите положительную корреляцию между продажами мороженого и количеством утоплений по дням. Это типичный пример ложной связи. Что наиболее вероятно объясняет наблюдение?
- Вы нашли корреляцию между количеством показов рекламы и выручкой. Но вы знаете, что в праздники и показы, и выручка растут. Как лучше описать риск интерпретации?
- Все вопросы по «Корреляция и регрессия» →