Вы построили линейную регрессию churn = a + b*notifications и получили b > 0. Менеджер говорит: уведомления увеличивают отток, выключаем. Какое уточнение по допущениям самое важное перед причинным выводом?

AДополнительные уточнения не требуются: положительный коэффициент регрессии означает причинное влияние
BДостаточно пересчитать корреляцию Пирсона: она точнее регрессии и даёт причинный ответ
CПроверить наличие скрытого смешивающего фактора и неслучайность назначения уведомлений пользователям
DУвеличить выборку для снижения p-value: вывод о причинности станет надёжнее с большим объёмом данных
Правильный ответ. Коэффициент регрессии не становится причинным без сильных допущений и контроля смешивающих факторов.

Разбор

Если уведомления чаще получают пользователи, которые уже на грани ухода, то смешивающий фактор даст положительный b даже без вреда от уведомлений. Регрессия в наблюдательных данных часто описывает связь, а не эффект вмешательства. Для причинного вывода нужен эксперимент, квазиэксперимент или явный контроль ключевых факторов и проверка допущений.

Проверь себя · 1/3разбор после ответа
У вас миллион наблюдений, Pearson r между двумя метриками равен 0.03, а p-value очень маленький. Какой вывод наиболее корректен для продукта?
Тренировать статистику в Telegram

Ещё вопросы по теме «Корреляция и регрессия»