Вы оценили влияние цены на продажи через линейная регрессия sales = a + b*price и получили отрицательный b. Но в данных есть промо: при промо цена ниже и продажи выше, а промо не включили в модель. Какой риск наиболее типичен?
AРиска нет:
Pearson r уже учел промо автоматическиBКоэффициент
b может быть смещен из-за confounding (смешение факторов), потому что промо связано и с ценой, и с продажамиCКоэффициент
b всегда станет равен 0 при наличии промоDЭто автоматически превращает задачу в
Poisson(λ)Правильный ответ. Пропущенный фактор, связанный и с
x, и с y, создает confounding (смешение факторов) и смещение.Разбор
Промо влияет на продажи напрямую и одновременно меняет цену, поэтому цена начинает отражать эффекты промо. Тогда b в линейная регрессия захватывает смесь причин, и интерпретация наклона становится неверной. Типичный фикс — добавить промо как переменную, либо строить дизайн, где назначение цены не связано с промо.
Проверь себя · 1/3разбор после ответа
В
линейной регрессии вида y = a + b*x что означает интерсепт a?Ещё вопросы по теме «Корреляция и регрессия»
- В отчете нашли положительную `correlation` между числом пушей на пользователя и выручкой. Какой вывод наиболее корректен?
- В данных по товарам `Pearson r` между ценой и конверсией равен -0.7. Как это интерпретировать?
- У вас 100 наблюдений, где почти нет связи между `x` и `y`, но есть одна точка с очень большим `x` и `y`. После добавления этой точки `Pearson r` стал 0.8. Что это чаще всего означает?
- Конверсия растет со скидкой до порога, а затем почти не меняется. При этом `Pearson r` между скидкой и конверсией близок к 0. Какой вывод корректен?
- Вы видите положительную `correlation` между продажами мороженого и количеством утоплений по дням. Это типичный пример спуриозной (`spurious`) связи. Что наиболее вероятно объясняет наблюдение?
- Все вопросы по «Корреляция и регрессия» →