Вы построили линейная регрессия churn = a + b*notifications и получили b > 0. PM говорит: уведомления увеличивают отток, выключаем. Какое уточнение по допущениям самое важное перед причинным выводом?

AНикаких: коэффициент регрессии всегда означает причинность
BДостаточно пересчитать Pearson r, он точнее
CНужно просто увеличить выборку, чтобы p-value стал меньше
DНужно проверить, нет ли скрытого confounding (смешение факторов) и почему пользователи получают уведомления (назначение не случайно)
Правильный ответ. Коэффициент регрессии не становится причинным без сильных допущений.

Разбор

Если уведомления чаще получают пользователи, которые уже на грани ухода, то confounding (смешение факторов) даст положительный b даже без вреда от уведомлений. Регрессия в наблюдательных данных часто описывает связь, а не эффект вмешательства. Для причинного вывода нужен эксперимент, квазиэксперимент или явный контроль ключевых факторов и проверка допущений.

Проверь себя · 1/3разбор после ответа
Вы хотите быстро проверить, есть ли линейная связь между avg_session_time и conversion rate на уровне пользователя. Что наиболее подходит как первый шаг?
Тренировать статистику в Telegram

Ещё вопросы по теме «Корреляция и регрессия»