В простой линейной регрессии с одним признаком x квадрат коэффициента корреляции Пирсона (то есть r^2) чаще всего интерпретируют как…
AСреднее значение
y в наблюдаемой выборке, посчитанное с учётом веса каждой точкиBВероятность того, что
x причинно влияет на y, при условии линейности их связиCЧисло испытаний до первого успеха в схеме независимых испытаний с одинаковой вероятностью
DДолю дисперсии
y, которую объясняет линейная связь с x в этой простой моделиПравильный ответ.
r^2 в простой регрессии связан с долей объяснённой вариативности зависимой переменной.Разбор
Если r^2 равно 0.25, это означает, что линейная модель с x объясняет около четверти вариации y относительно среднего. Это не говорит о причинности и не гарантирует хороших предсказаний для каждого наблюдения. Частая ошибка — читать r^2 как долю «причины» или как точность модели без проверки остатков. Корреляция Пирсона измеряет только линейную связь, поэтому при нелинейных зависимостях r^2 может быть низким даже при сильной связи.
Проверь себя · 1/3разбор после ответа
У вас миллион наблюдений,
Pearson r между двумя метриками равен 0.03, а p-value очень маленький. Какой вывод наиболее корректен для продукта?Ещё вопросы по теме «Корреляция и регрессия»
- В отчёте нашли положительную корреляцию между числом пушей на пользователя и выручкой. Какой вывод наиболее корректен?
- В данных по товарам коэффициент корреляции Пирсона между ценой и конверсией равен -0.7. Как это интерпретировать?
- У вас 100 наблюдений, где почти нет связи между `x` и `y`, но есть одна точка с очень большим `x` и `y`. После добавления этой точки `Pearson r` стал 0.8. Что это чаще всего означает?
- Конверсия растёт со скидкой до порога, а затем почти не меняется. При этом `Pearson r` между скидкой и конверсией близок к 0. Какой вывод корректен?
- Вы видите положительную корреляцию между продажами мороженого и количеством утоплений по дням. Это типичный пример ложной связи. Что наиболее вероятно объясняет наблюдение?
- Все вопросы по «Корреляция и регрессия» →