Конверсия растет со скидкой до порога, а затем почти не меняется. При этом Pearson r между скидкой и конверсией близок к 0. Какой вывод корректен?
AЭто доказывает отсутствие любой связи
BЭто означает, что данных мало и нужно больше
CЭто означает, что
correlation всегда бесполезна для продуктовых метрикDНулевая
correlation по Pearson r возможна при сильной нелинейной связи, потому что Pearson r измеряет линейностьПравильный ответ. Нулевая
Pearson r не исключает нелинейную связь.Разбор
Pearson r хорошо ловит именно линейные зависимости. Если связь насыщается или имеет порог, линейная мера может давать значение около нуля. В таких случаях стоит визуализировать данные или использовать модели, которые учитывают форму зависимости, а не только линейность.
Проверь себя · 1/3разбор после ответа
В модели
линейная регрессия вида revenue = a + b*emails коэффициент b равен 0.8. Как правильно интерпретировать b?Ещё вопросы по теме «Корреляция и регрессия»
- В отчете нашли положительную `correlation` между числом пушей на пользователя и выручкой. Какой вывод наиболее корректен?
- В данных по товарам `Pearson r` между ценой и конверсией равен -0.7. Как это интерпретировать?
- У вас 100 наблюдений, где почти нет связи между `x` и `y`, но есть одна точка с очень большим `x` и `y`. После добавления этой точки `Pearson r` стал 0.8. Что это чаще всего означает?
- Вы видите положительную `correlation` между продажами мороженого и количеством утоплений по дням. Это типичный пример спуриозной (`spurious`) связи. Что наиболее вероятно объясняет наблюдение?
- Вы нашли `correlation` между количеством показов рекламы и выручкой. Но вы знаете, что в праздники и показы, и выручка растут. Как лучше описать риск интерпретации?
- Все вопросы по «Корреляция и регрессия» →