Вы подозреваете, что связь между числом пушей и оттоком объясняется тем, что пуши чаще получают новички. Что лучше сделать, чтобы снизить влияние confounding в анализе?

AУвеличить alpha, чтобы быстрее получить вывод
BСтратифицировать по статусу новичок/опытный или добавить этот фактор в линейная регрессия
CЗаменить Pearson r на Spearman и не учитывать сегменты
DСчитать только пользователей с 0 пушей и сравнить их с остальными
Правильный ответ. Контроль confounding достигается сегментацией или добавлением факторов в модель.

Разбор

Если статус пользователя влияет и на получение пушей, и на отток, он искажает оценку связи. Разбиение на сегменты или добавление переменной в линейная регрессия делает сравнение более сопоставимым. Это не гарантирует причинность, но снижает риск неправильной интерпретации из-за явного confounding.

Проверь себя · 1/3разбор после ответа
В отчете нашли положительную correlation между числом пушей на пользователя и выручкой. Какой вывод наиболее корректен?
Тренировать статистику в Telegram

Ещё вопросы по теме «Корреляция и регрессия»