Вы построили линейная регрессия churn = a + b*notifications и получили b > 0. PM говорит: уведомления увеличивают отток, выключаем. Какое уточнение по допущениям самое важное перед причинным выводом?
AНикаких: коэффициент регрессии всегда означает причинность
BДостаточно пересчитать
Pearson r, он точнееCНужно просто увеличить выборку, чтобы
p-value стал меньшеDНужно проверить, нет ли скрытого
confounding (смешение факторов) и почему пользователи получают уведомления (назначение не случайно)Правильный ответ. Коэффициент регрессии не становится причинным без сильных допущений.
Разбор
Если уведомления чаще получают пользователи, которые уже на грани ухода, то confounding (смешение факторов) даст положительный b даже без вреда от уведомлений. Регрессия в наблюдательных данных часто описывает связь, а не эффект вмешательства. Для причинного вывода нужен эксперимент, квазиэксперимент или явный контроль ключевых факторов и проверка допущений.
Проверь себя · 1/3разбор после ответа
Вы хотите быстро проверить, есть ли линейная связь между
avg_session_time и conversion rate на уровне пользователя. Что наиболее подходит как первый шаг?Ещё вопросы по теме «Корреляция и регрессия»
- В отчете нашли положительную `correlation` между числом пушей на пользователя и выручкой. Какой вывод наиболее корректен?
- В данных по товарам `Pearson r` между ценой и конверсией равен -0.7. Как это интерпретировать?
- У вас 100 наблюдений, где почти нет связи между `x` и `y`, но есть одна точка с очень большим `x` и `y`. После добавления этой точки `Pearson r` стал 0.8. Что это чаще всего означает?
- Конверсия растет со скидкой до порога, а затем почти не меняется. При этом `Pearson r` между скидкой и конверсией близок к 0. Какой вывод корректен?
- Вы видите положительную `correlation` между продажами мороженого и количеством утоплений по дням. Это типичный пример спуриозной (`spurious`) связи. Что наиболее вероятно объясняет наблюдение?
- Все вопросы по «Корреляция и регрессия» →