В каком случае использование коэффициента Пирсона r для измерения связи наиболее уместно?

AКогда хотя бы одна переменная категориальная и принимает несколько разных дискретных значений
BКогда связь между переменными точно U-образная и вы хотите количественно оценить нелинейность
CКогда нужно посчитать число событий за фиксированный интервал времени и сравнить интенсивность
DКогда две числовые переменные имеют примерно линейную связь и вы проверили влияние выбросов
Правильный ответ. Коэффициент Пирсона r лучше всего работает для линейной связи между числовыми переменными.

Разбор

Коэффициент Пирсона r измеряет линейную ассоциацию и чувствителен к выбросам. Поэтому обычно смотрят график и проверяют, что данные не состоят из категорий, закодированных числами. Для нелинейных зависимостей нулевая корреляция не означает отсутствие связи — например, при U-образной форме r может быть около нуля при сильной зависимости. Поэтому выбор меры связи зависит от постановки задачи и формы данных.

Проверь себя · 1/3разбор после ответа
Вы построили линейную регрессию churn = a + b*notifications и получили b > 0. Менеджер говорит: уведомления увеличивают отток, выключаем. Какое уточнение по допущениям самое важное перед причинным выводом?
Тренировать статистику в Telegram

Ещё вопросы по теме «Корреляция и регрессия»