Вы построили `линейная регрессия` `churn = a + b*notifications` и получили `b 0`. PM говорит: уведомления увеличивают отток, выключаем. Какое уточнение по допущениям самое важное перед причинным выводом?

Question

Вы построили `линейная регрессия` `churn = a + b*notifications` и получили `b > 0`. PM говорит: уведомления увеличивают отток, выключаем. Какое уточнение по допущениям самое важное перед причинным выводом?

Карьерник · Accepted Answer

Правильный ответ: Никаких: коэффициент регрессии всегда означает причинность. Коэффициент регрессии не становится причинным без сильных допущений. Если уведомления чаще получают пользователи, которые уже на грани ухода, то `confounding` (смешение факторов) даст положительный `b` даже без вреда от уведомлений. Регрессия в наблюдательных данных часто описывает связь, а не эффект вмешательства. Для причинного вывода нужен эксперимент, квазиэксперимент или явный контроль ключевых факторов и проверка допущений.

Разбор

Ещё вопросы по теме «Корреляция и регрессия»