На точечной диаграмме есть один сильный выброс далеко от основного облака. Как это чаще всего влияет на корреляцию и линию тренда?
AМожет резко изменить и корреляцию, и наклон линии; стоит проверить устойчивость, например сравнить с выбросом и без
BПочти не влияет на корреляцию: один выброс всегда можно игнорировать, а наклон линии регрессии останется примерно прежним
CВлияет только на цвет и размер точек на графике, но не на численное значение корреляции и не на параметры линейной регрессии
DАвтоматически делает связь причинной: один выброс далеко от облака подтверждает гипотезу о причине и следствии между переменными
Правильный ответ. Выброс может сильно тянуть корреляцию и линейную аппроксимацию.
Разбор
Один дальний пункт способен изменить наклон и сделать корреляцию выше или ниже, чем для основной массы. Полезно отметить выброс и проверить выводы альтернативными оценками или визуализациями.
Проверь себя · 1/3разбор после ответа
На диаграмме рассеяния переменная X имеет сильную асимметрию (значения от 1 до 1 000 000), а связь выглядит мультипликативной. Что чаще всего улучшит читаемость?
Ещё вопросы по теме «Зависимости и scatter-графики»
- Какой график лучше всего подходит, чтобы показать связь между двумя числовыми переменными на уровне отдельных наблюдений (например, `price` и `quantity`)?
- На диаграмме рассеяния посчитан коэффициент корреляции r = -0.8 между X и Y. Что это означает?
- Вы увидели на диаграмме рассеяния высокую корреляцию между числом уведомлений и оттоком. Какой вывод корректнее всего?
- На точечной диаграмме с сотнями тысяч точек всё сливается в сплошное пятно из-за наложения. Что сделать первым, чтобы увидеть структуру плотности?
- Когда добавление линии тренда на точечную диаграмму обычно наиболее уместно?
- Все вопросы по «Зависимости и scatter-графики» →