Модель линейная регрессия обучена на скидках от 0 до 30%. PM просит предсказать конверсию при скидке 80%. Какой ответ наиболее корректен?
AМожно смело предсказывать, потому что регрессия линейная
BНужно только посчитать
Pearson r, тогда предсказание будет точнымCДостаточно увеличить число наблюдений в диапазоне 0–30%, и можно экстраполировать на 80%
DЭто экстраполяция вне диапазона данных: предсказание может быть неверным, лучше собрать данные в этом диапазоне или изменить дизайн
Правильный ответ. Экстраполяция вне диапазона данных — частая ловушка в регрессии.
Разбор
Линейная модель может хорошо описывать связь в наблюдаемом диапазоне и при этом давать абсурдные значения за его пределами. При скидке 80% могут включиться другие механизмы, и линейность нарушится. Поэтому корректнее либо собрать данные в нужном диапазоне, либо заранее ограничить область применения модели.
Проверь себя · 1/3разбор после ответа
В
линейной регрессии вида y = a + b*x что означает интерсепт a?Ещё вопросы по теме «Корреляция и регрессия»
- В отчете нашли положительную `correlation` между числом пушей на пользователя и выручкой. Какой вывод наиболее корректен?
- В данных по товарам `Pearson r` между ценой и конверсией равен -0.7. Как это интерпретировать?
- У вас 100 наблюдений, где почти нет связи между `x` и `y`, но есть одна точка с очень большим `x` и `y`. После добавления этой точки `Pearson r` стал 0.8. Что это чаще всего означает?
- Конверсия растет со скидкой до порога, а затем почти не меняется. При этом `Pearson r` между скидкой и конверсией близок к 0. Какой вывод корректен?
- Вы видите положительную `correlation` между продажами мороженого и количеством утоплений по дням. Это типичный пример спуриозной (`spurious`) связи. Что наиболее вероятно объясняет наблюдение?
- Все вопросы по «Корреляция и регрессия» →