Вы оценили влияние цены на продажи через линейную регрессию sales = a + b*price и получили отрицательный b. Но в данных есть промо: при промо цена ниже и продажи выше, а промо в модель не включили. Какой риск наиболее типичен?

AРиска нет: коэффициент корреляции уже учёл влияние промо автоматически и наклон цены интерпретируется чисто
BКоэффициент b смещён из-за смешения факторов: промо одновременно меняет цену и продажи, и это попадает в наклон цены
CКоэффициент b всегда становится равен нулю при наличии промо, потому что промо обнуляет связь между ценой и продажами
DЗадача автоматически превращается в пуассоновскую регрессию, и наклон цены теряет интерпретацию из-за смены модели
Правильный ответ. Пропущенный фактор, связанный и с x, и с y, создаёт смешение факторов и смещает оценку наклона.

Разбор

Промо одновременно влияет на продажи и снижает цену, поэтому цена в модели начинает отражать эффекты промо. Тогда наклон b ловит смесь причин, и его интерпретация становится неверной. Типичный фикс — добавить промо как переменную в модель или использовать дизайн, где назначение цены не связано с промо. Корреляция и пуассоновская регрессия эту проблему не устраняют, а отсутствие связи цена–продажи в принципе невозможно гарантировать промо-периодом.

Проверь себя · 1/3разбор после ответа
Вы подозреваете, что связь между числом пушей и оттоком объясняется тем, что пуши чаще получают новички. Что лучше сделать, чтобы снизить влияние смешивающего фактора в анализе?
Тренировать статистику в Telegram

Ещё вопросы по теме «Корреляция и регрессия»