В отчёте нашли положительную корреляцию между числом пушей на пользователя и выручкой. Какой вывод наиболее корректен?

AНельзя утверждать причинность: корреляция показывает связь, но не доказывает, что пуши увеличили выручку у пользователей
BПуши точно увеличили выручку: положительный коэффициент корреляции на пользовательском уровне эквивалентен причинной связи
CПричинность подтверждена при коэффициенте корреляции Пирсона выше 0.5, а ниже эффект списывают на случайный шум данных
DПричинность подтверждена сбором данных за один и тот же месяц по одной аудитории активных пользователей продукта
Правильный ответ. Связь в данных не равна причинному эффекту: для причинности нужен эксперимент или сопоставимые группы.

Разбор

Положительная корреляция между числом пушей и выручкой по пользователям не означает, что пуши вызвали рост выручки. Скорее всего работает обратный отбор: активные платящие пользователи и так чаще открывают приложение, поэтому им чаще успевают отправить пуш-уведомление. Чтобы измерить эффект, нужен A/B-тест с рандомизацией пушей. Никакого магического порога коэффициента корреляции для подтверждения причинности нет. Сбор данных за один период не устраняет конфаундеры — нужен случайный механизм, разделяющий пользователей независимо от их прошлого поведения.

Проверь себя · 1/3разбор после ответа
В простой линейной регрессии с одним признаком x квадрат коэффициента корреляции Пирсона (то есть r^2) чаще всего интерпретируют как…
Тренировать статистику в Telegram

Ещё вопросы по теме «Корреляция и регрессия»