Когда использование Pearson r наиболее уместно?
AКогда две числовые переменные имеют примерно линейную связь и вы проверили влияние выбросов
BКогда хотя бы одна переменная категориальная с несколькими значениями
CКогда связь точно U-образная и вы хотите оценить нелинейность
DКогда нужно посчитать число событий за интервал времени
Правильный ответ.
Pearson r лучше всего работает для линейной связи между числовыми переменными.Разбор
Pearson r измеряет линейную ассоциацию и чувствителен к выбросам. Поэтому обычно смотрят график и проверяют, что данные не состоят из категорий, закодированных числами. Для нелинейных зависимостей нулевая Pearson r не означает отсутствие связи, поэтому выбор меры зависит от постановки.
Проверь себя · 1/3разбор после ответа
Вы нашли
correlation между количеством показов рекламы и выручкой. Но вы знаете, что в праздники и показы, и выручка растут. Как лучше описать риск интерпретации?Ещё вопросы по теме «Корреляция и регрессия»
- В отчете нашли положительную `correlation` между числом пушей на пользователя и выручкой. Какой вывод наиболее корректен?
- В данных по товарам `Pearson r` между ценой и конверсией равен -0.7. Как это интерпретировать?
- У вас 100 наблюдений, где почти нет связи между `x` и `y`, но есть одна точка с очень большим `x` и `y`. После добавления этой точки `Pearson r` стал 0.8. Что это чаще всего означает?
- Конверсия растет со скидкой до порога, а затем почти не меняется. При этом `Pearson r` между скидкой и конверсией близок к 0. Какой вывод корректен?
- Вы видите положительную `correlation` между продажами мороженого и количеством утоплений по дням. Это типичный пример спуриозной (`spurious`) связи. Что наиболее вероятно объясняет наблюдение?
- Все вопросы по «Корреляция и регрессия» →