Модель линейная регрессия обучена на скидках от 0 до 30%. PM просит предсказать конверсию при скидке 80%. Какой ответ наиболее корректен?

AМожно смело предсказывать, потому что регрессия линейная
BНужно только посчитать Pearson r, тогда предсказание будет точным
CДостаточно увеличить число наблюдений в диапазоне 0–30%, и можно экстраполировать на 80%
DЭто экстраполяция вне диапазона данных: предсказание может быть неверным, лучше собрать данные в этом диапазоне или изменить дизайн
Правильный ответ. Экстраполяция вне диапазона данных — частая ловушка в регрессии.

Разбор

Линейная модель может хорошо описывать связь в наблюдаемом диапазоне и при этом давать абсурдные значения за его пределами. При скидке 80% могут включиться другие механизмы, и линейность нарушится. Поэтому корректнее либо собрать данные в нужном диапазоне, либо заранее ограничить область применения модели.

Проверь себя · 1/3разбор после ответа
В линейной регрессии вида y = a + b*x что означает интерсепт a?
Тренировать статистику в Telegram

Ещё вопросы по теме «Корреляция и регрессия»