На диаграмме рассеяния связь монотонная, но заметно нелинейная: точки образуют кривую. Какая мера корреляции чаще подходит для описания такой монотонности?
AКоэффициент детерминации
R^2 из линейной регрессии как универсальная мера силы любой связи между двумя переменнымиB
p-value критерия значимости как мера силы связи: чем меньше значение, тем сильнее зависимость между переменнымиCКоэффициент
Pearson как мера общей зависимости, в том числе для нелинейных кривых с выраженной монотонностьюDКоэффициент
Spearman по рангам как мера монотонной связи, устойчивая к нелинейности и к выбросам в данныхПравильный ответ. Коэффициент
Spearman по рангам измеряет монотонную связь и устойчивее к нелинейности, чем Pearson.Разбор
Коэффициент Pearson отражает линейную зависимость и может быть низким даже при сильной кривой. Коэффициент Spearman использует ранги и лучше описывает ситуацию, когда рост X ведёт к росту или падению Y без требования линейности. R^2 и p-value отвечают на другие вопросы и не подходят как самостоятельная мера силы монотонной связи.
Проверь себя · 1/3разбор после ответа
На диаграмме рассеяния переменная X имеет сильную асимметрию (значения от 1 до 1 000 000), а связь выглядит мультипликативной. Что чаще всего улучшит читаемость?
Ещё вопросы по теме «Зависимости и scatter-графики»
- Какой график лучше всего подходит, чтобы показать связь между двумя числовыми переменными на уровне отдельных наблюдений (например, `price` и `quantity`)?
- На диаграмме рассеяния посчитан коэффициент корреляции r = -0.8 между X и Y. Что это означает?
- Вы увидели на диаграмме рассеяния высокую корреляцию между числом уведомлений и оттоком. Какой вывод корректнее всего?
- На точечной диаграмме с сотнями тысяч точек всё сливается в сплошное пятно из-за наложения. Что сделать первым, чтобы увидеть структуру плотности?
- Когда добавление линии тренда на точечную диаграмму обычно наиболее уместно?
- Все вопросы по «Зависимости и scatter-графики» →