В отчёте нашли положительную корреляцию между числом пушей на пользователя и выручкой. Какой вывод наиболее корректен?
AНельзя утверждать причинность: корреляция показывает связь, но не доказывает, что пуши увеличили выручку у пользователей
BПуши точно увеличили выручку: положительный коэффициент корреляции на пользовательском уровне эквивалентен причинной связи
CПричинность подтверждена при коэффициенте корреляции Пирсона выше 0.5, а ниже эффект списывают на случайный шум данных
DПричинность подтверждена сбором данных за один и тот же месяц по одной аудитории активных пользователей продукта
Правильный ответ. Связь в данных не равна причинному эффекту: для причинности нужен эксперимент или сопоставимые группы.
Разбор
Положительная корреляция между числом пушей и выручкой по пользователям не означает, что пуши вызвали рост выручки. Скорее всего работает обратный отбор: активные платящие пользователи и так чаще открывают приложение, поэтому им чаще успевают отправить пуш-уведомление. Чтобы измерить эффект, нужен A/B-тест с рандомизацией пушей. Никакого магического порога коэффициента корреляции для подтверждения причинности нет. Сбор данных за один период не устраняет конфаундеры — нужен случайный механизм, разделяющий пользователей независимо от их прошлого поведения.
Проверь себя · 1/3разбор после ответа
В простой линейной регрессии с одним признаком
x квадрат коэффициента корреляции Пирсона (то есть r^2) чаще всего интерпретируют как…Ещё вопросы по теме «Корреляция и регрессия»
- В данных по товарам коэффициент корреляции Пирсона между ценой и конверсией равен -0.7. Как это интерпретировать?
- У вас 100 наблюдений, где почти нет связи между `x` и `y`, но есть одна точка с очень большим `x` и `y`. После добавления этой точки `Pearson r` стал 0.8. Что это чаще всего означает?
- Конверсия растёт со скидкой до порога, а затем почти не меняется. При этом `Pearson r` между скидкой и конверсией близок к 0. Какой вывод корректен?
- Вы видите положительную корреляцию между продажами мороженого и количеством утоплений по дням. Это типичный пример ложной связи. Что наиболее вероятно объясняет наблюдение?
- Вы нашли корреляцию между количеством показов рекламы и выручкой. Но вы знаете, что в праздники и показы, и выручка растут. Как лучше описать риск интерпретации?
- Все вопросы по «Корреляция и регрессия» →