Вы сравниваете retention между region A и region B. В region A больше пользователей из более «старых» когорт, а в region B — больше новых. Что корректнее сделать, чтобы сравнение было справедливым?
AСравнить общий
retention как есть и не учитывать составBСделать
stratification по cohort стажу и сравнивать like-for-like внутри стажаCИсключить всех пользователей из
region A, чтобы базы стали одинаковымиDЗаменить
retention на любую другую метрику, чтобы не думать о confounderПравильный ответ. Разный состав по
cohort создаёт confounder, поэтому нужна stratification для сравнения like-for-like.Разбор
Если «возраст когорты» влияет на retention и распределён по region неравномерно, общий результат будет искажён. Stratification по возрасту когорты позволяет сравнивать сопоставимые группы пользователей, а затем корректно собрать общий вывод. Такой подход помогает отделить различие продукта от различий аудитории.
Проверь себя · 1/3разбор после ответа
Вы сравниваете
conversion rate между channel = search и channel = social. В channel = search заметно больше пользователей из region с высокой платежеспособностью. Какой наиболее вероятный confounder и что логично использовать как control variable?Ещё вопросы по теме «Сегментация и конфаундинг»
- После запуска новой версии приложения общий `conversion rate` упал. При этом выросла доля трафика на `android` (`platform` = `android`), а у `android` исторически ниже `base rate`. Какое объяснение наиболее правдоподобно без дополнительных данных?
- Вы сравниваете `conversion rate` между `channel` = `search` и `channel` = `social`. В `channel` = `search` заметно больше пользователей из `region` с высокой платежеспособностью. Какой наиболее вероятный `confounder` и что логично использовать как `control variable`?
- Новая функция включается кнопкой, и анализ показал, что у включивших выше `retention` и `conversion rate`. Какая основная проблема такого вывода?
- В сегменте `ios` `conversion rate` вырос, и в сегменте `android` тоже вырос, но общий `conversion rate` по всем `users` снизился. Какое объяснение наиболее вероятно?
- Вы хотите сравнить `conversion rate` между `platform` = `ios` и `platform` = `android`, но подозреваете, что в `ios` больше трафика из `channel` = `email`. Какой способ контроля наиболее корректен?
- Все вопросы по «Сегментация и конфаундинг» →