Вы увидели на диаграмме рассеяния высокую корреляцию между числом уведомлений и оттоком. Какой вывод корректнее всего?

AУведомления увеличивают отток: нужно отключить рассылки и зафиксировать снижение оттока в отчёте на этой неделе
BВысокая корреляция означает, что отток заставляет систему отправлять больше уведомлений, и связь причинная
CПо одной корреляции нельзя утверждать причинность: нужны эксперимент или контроль смешивающих факторов
DПри высокой корреляции ошибки измерения и смешивающие факторы исключены, поэтому вывод о причинности обоснован
Правильный ответ. Корреляция не равна причинности без дизайна, который исключает смешивающие факторы и обратную зависимость.

Разбор

Связь может быть вызвана третьим фактором, например активностью: активным пользователям отправляют больше уведомлений, и они же реже уходят (или наоборот). Для причинного вывода нужны рандомизация, квази-эксперимент или хотя бы тщательный контроль смешивающих факторов. Высокое значение корреляции само по себе не исключает ошибок измерения и обратной зависимости.

Проверь себя · 1/3разбор после ответа
На диаграмме рассеяния для двух переменных общий рисунок кажется без связи, но вы подозреваете, что разные сегменты ведут себя по-разному. Какой приём лучше всего помогает не смешивать сегменты?
Открыть Карьерник в Telegram

Ещё вопросы по теме «Зависимости и scatter-графики»