Вы увидели на scatter plot высокую correlation между числом уведомлений и churn. Какой вывод корректнее всего?
AУведомления точно увеличивают churn, нужно немедленно отключить
BChurn точно заставляет систему отправлять больше уведомлений
CПо одной
correlation нельзя утверждать causation; нужны эксперимент или контроль смешивающих факторовDЕсли
correlation высокая, то ошибок измерения быть не можетПравильный ответ.
correlation не равна causation без дизайна, который исключает конфаундеры.Разбор
Связь может быть вызвана третьим фактором, например активностью: активным шлют больше, и они же меньше уходят (или наоборот). Для причинного вывода нужны рандомизация, квази‑эксперимент или хотя бы тщательный контроль конфаундеров.
Проверь себя · 1/3разбор после ответа
В
scatter plot для двух переменных общий рисунок кажется без связи, но вы подозреваете, что разные сегменты ведут себя по-разному. Какой приём лучше всего помогает не смешивать сегменты?Ещё вопросы по теме «Зависимости и scatter-графики»
- Какой график лучше всего подходит, чтобы показать связь между двумя числовыми переменными на уровне наблюдений (например `price` и `quantity`)?
- На `scatter plot` посчитана `correlation` r = -0.8 между X и Y. Что это означает?
- В `scatter plot` с сотнями тысяч точек всё сливается в сплошное пятно (`overplotting`). Что сделать первым, чтобы увидеть структуру плотности?
- Когда добавление `trend line` на `scatter plot` обычно наиболее уместно?
- На `scatter plot` переменная X имеет сильную асимметрию (значения от 1 до 1 000 000), а связь выглядит мультипликативной. Что чаще всего улучшит читаемость?
- Все вопросы по «Зависимости и scatter-графики» →