На scatter plot есть один сильный outlier далеко от основного облака. Как это чаще всего влияет на correlation и линейную trend line?

AПочти не влияет: один outlier всегда можно игнорировать
BВлияет только на цвет точек, но не на статистику
CМожет резко изменить и correlation, и наклон линии; стоит проверить устойчивость (например сравнить с и без выброса)
DАвтоматически делает связь причинной (causation)
Правильный ответ. outlier может сильно тянуть correlation и линейную аппроксимацию.

Разбор

Один дальний пункт способен изменить наклон и сделать correlation выше или ниже, чем для основной массы. Полезно отметить выброс и проверить выводы альтернативными оценками или визуализациями.

Проверь себя · 1/3разбор после ответа
Если вы замените единицы X с метров на сантиметры (то есть умножите X на 100), что произойдёт с correlation между X и Y?
Открыть Карьерник в Telegram

Ещё вопросы по теме «Зависимости и scatter-графики»