Вы подозреваете, что связь между числом пушей и оттоком объясняется тем, что пуши чаще получают новички. Что лучше сделать, чтобы снизить влияние confounding в анализе?
AУвеличить
alpha, чтобы быстрее получить выводBСтратифицировать по статусу новичок/опытный или добавить этот фактор в
линейная регрессияCЗаменить
Pearson r на Spearman и не учитывать сегментыDСчитать только пользователей с 0 пушей и сравнить их с остальными
Правильный ответ. Контроль
confounding достигается сегментацией или добавлением факторов в модель.Разбор
Если статус пользователя влияет и на получение пушей, и на отток, он искажает оценку связи. Разбиение на сегменты или добавление переменной в линейная регрессия делает сравнение более сопоставимым. Это не гарантирует причинность, но снижает риск неправильной интерпретации из-за явного confounding.
Проверь себя · 1/3разбор после ответа
В отчете нашли положительную
correlation между числом пушей на пользователя и выручкой. Какой вывод наиболее корректен?Ещё вопросы по теме «Корреляция и регрессия»
- В отчете нашли положительную `correlation` между числом пушей на пользователя и выручкой. Какой вывод наиболее корректен?
- В данных по товарам `Pearson r` между ценой и конверсией равен -0.7. Как это интерпретировать?
- У вас 100 наблюдений, где почти нет связи между `x` и `y`, но есть одна точка с очень большим `x` и `y`. После добавления этой точки `Pearson r` стал 0.8. Что это чаще всего означает?
- Конверсия растет со скидкой до порога, а затем почти не меняется. При этом `Pearson r` между скидкой и конверсией близок к 0. Какой вывод корректен?
- Вы видите положительную `correlation` между продажами мороженого и количеством утоплений по дням. Это типичный пример спуриозной (`spurious`) связи. Что наиболее вероятно объясняет наблюдение?
- Все вопросы по «Корреляция и регрессия» →