В простой линейной регрессии с одним признаком x квадрат коэффициента корреляции Пирсона (то есть r^2) чаще всего интерпретируют как…

AСреднее значение y в наблюдаемой выборке, посчитанное с учётом веса каждой точки
BВероятность того, что x причинно влияет на y, при условии линейности их связи
CЧисло испытаний до первого успеха в схеме независимых испытаний с одинаковой вероятностью
DДолю дисперсии y, которую объясняет линейная связь с x в этой простой модели
Правильный ответ. r^2 в простой регрессии связан с долей объяснённой вариативности зависимой переменной.

Разбор

Если r^2 равно 0.25, это означает, что линейная модель с x объясняет около четверти вариации y относительно среднего. Это не говорит о причинности и не гарантирует хороших предсказаний для каждого наблюдения. Частая ошибка — читать r^2 как долю «причины» или как точность модели без проверки остатков. Корреляция Пирсона измеряет только линейную связь, поэтому при нелинейных зависимостях r^2 может быть низким даже при сильной связи.

Проверь себя · 1/3разбор после ответа
У вас миллион наблюдений, Pearson r между двумя метриками равен 0.03, а p-value очень маленький. Какой вывод наиболее корректен для продукта?
Тренировать статистику в Telegram

Ещё вопросы по теме «Корреляция и регрессия»