Линейная регрессия обучена на скидках от 0 до 30%. Продакт-менеджер просит предсказать конверсию при скидке 80%. Какой ответ наиболее корректен?
AМожно смело предсказывать, потому что линейная регрессия одинаково работает для любых значений признака
BДостаточно увеличить число наблюдений в диапазоне 0–30%, и тогда модель будет уверенно экстраполировать на 80%
CНужно посчитать коэффициент корреляции Пирсона: при высокой корреляции экстраполяция становится надёжной автоматически
DЭто экстраполяция вне диапазона данных: предсказание может быть неверным, лучше собрать данные в нужном диапазоне
Правильный ответ. Экстраполяция вне диапазона данных — частая ловушка в регрессии: за пределами обучающего диапазона связь может перестать быть линейной.
Разбор
Линейная модель может хорошо описывать связь в наблюдаемом диапазоне и при этом давать абсурдные значения за его пределами. При скидке 80% могут включиться другие механизмы (отток платящих, насыщение спроса), и линейность нарушится. Поэтому корректнее либо собрать данные в нужном диапазоне, либо заранее ограничить область применения модели. Высокая корреляция Пирсона на старых данных тоже не гарантирует надёжной экстраполяции.
Проверь себя · 1/3разбор после ответа
Вы построили линейную регрессию
churn = a + b*notifications и получили b > 0. Менеджер говорит: уведомления увеличивают отток, выключаем. Какое уточнение по допущениям самое важное перед причинным выводом?Ещё вопросы по теме «Корреляция и регрессия»
- В отчёте нашли положительную корреляцию между числом пушей на пользователя и выручкой. Какой вывод наиболее корректен?
- В данных по товарам коэффициент корреляции Пирсона между ценой и конверсией равен -0.7. Как это интерпретировать?
- У вас 100 наблюдений, где почти нет связи между `x` и `y`, но есть одна точка с очень большим `x` и `y`. После добавления этой точки `Pearson r` стал 0.8. Что это чаще всего означает?
- Конверсия растёт со скидкой до порога, а затем почти не меняется. При этом `Pearson r` между скидкой и конверсией близок к 0. Какой вывод корректен?
- Вы видите положительную корреляцию между продажами мороженого и количеством утоплений по дням. Это типичный пример ложной связи. Что наиболее вероятно объясняет наблюдение?
- Все вопросы по «Корреляция и регрессия» →