Вы сравниваете retention между region A и region B. В region A больше пользователей из более «старых» когорт, а в region B — больше новых. Что корректнее сделать, чтобы сравнение было справедливым?

AСравнить общий retention как есть и не учитывать состав
BСделать stratification по cohort стажу и сравнивать like-for-like внутри стажа
CИсключить всех пользователей из region A, чтобы базы стали одинаковыми
DЗаменить retention на любую другую метрику, чтобы не думать о confounder
Правильный ответ. Разный состав по cohort создаёт confounder, поэтому нужна stratification для сравнения like-for-like.

Разбор

Если «возраст когорты» влияет на retention и распределён по region неравномерно, общий результат будет искажён. Stratification по возрасту когорты позволяет сравнивать сопоставимые группы пользователей, а затем корректно собрать общий вывод. Такой подход помогает отделить различие продукта от различий аудитории.

Проверь себя · 1/3разбор после ответа
Вы сравниваете conversion rate между channel = search и channel = social. В channel = search заметно больше пользователей из region с высокой платежеспособностью. Какой наиболее вероятный confounder и что логично использовать как control variable?
Открыть Карьерник в Telegram

Ещё вопросы по теме «Сегментация и конфаундинг»