Вы оценили влияние цены на продажи через линейную регрессию sales = a + b*price и получили отрицательный b. Но в данных есть промо: при промо цена ниже и продажи выше, а промо в модель не включили. Какой риск наиболее типичен?
AРиска нет: коэффициент корреляции уже учёл влияние промо автоматически и наклон цены интерпретируется чисто
BКоэффициент
b смещён из-за смешения факторов: промо одновременно меняет цену и продажи, и это попадает в наклон ценыCКоэффициент
b всегда становится равен нулю при наличии промо, потому что промо обнуляет связь между ценой и продажамиDЗадача автоматически превращается в пуассоновскую регрессию, и наклон цены теряет интерпретацию из-за смены модели
Правильный ответ. Пропущенный фактор, связанный и с
x, и с y, создаёт смешение факторов и смещает оценку наклона.Разбор
Промо одновременно влияет на продажи и снижает цену, поэтому цена в модели начинает отражать эффекты промо. Тогда наклон b ловит смесь причин, и его интерпретация становится неверной. Типичный фикс — добавить промо как переменную в модель или использовать дизайн, где назначение цены не связано с промо. Корреляция и пуассоновская регрессия эту проблему не устраняют, а отсутствие связи цена–продажи в принципе невозможно гарантировать промо-периодом.
Проверь себя · 1/3разбор после ответа
Вы подозреваете, что связь между числом пушей и оттоком объясняется тем, что пуши чаще получают новички. Что лучше сделать, чтобы снизить влияние смешивающего фактора в анализе?
Ещё вопросы по теме «Корреляция и регрессия»
- В отчёте нашли положительную корреляцию между числом пушей на пользователя и выручкой. Какой вывод наиболее корректен?
- В данных по товарам коэффициент корреляции Пирсона между ценой и конверсией равен -0.7. Как это интерпретировать?
- У вас 100 наблюдений, где почти нет связи между `x` и `y`, но есть одна точка с очень большим `x` и `y`. После добавления этой точки `Pearson r` стал 0.8. Что это чаще всего означает?
- Конверсия растёт со скидкой до порога, а затем почти не меняется. При этом `Pearson r` между скидкой и конверсией близок к 0. Какой вывод корректен?
- Вы видите положительную корреляцию между продажами мороженого и количеством утоплений по дням. Это типичный пример ложной связи. Что наиболее вероятно объясняет наблюдение?
- Все вопросы по «Корреляция и регрессия» →