Новая функция доступна только users, которые включили beta. Команда сравнила их retention с остальными users и увидела рост. Какой следующий шаг наиболее корректен для анализа?
AСразу запускать функцию на всех, потому что
retention вышеBИгнорировать результат, потому что
segment beta слишком маленькийCПризнать риск
selection bias и пытаться получить сравнение без self-selection, например через randomization или like-for-like с control variableDУвеличить
denominator по времени, пока не получится нужный выводПравильный ответ. Добровольный
beta почти всегда создаёт selection bias, поэтому нужно сравнение без self-selection.Разбор
Пользователи beta обычно более мотивированы, и их base rate может быть выше. Поэтому рост retention может отражать состав аудитории, а не эффект функции. Лучшее решение — сделать randomization или сопоставимое сравнение like-for-like с контролем ключевых факторов.
Проверь себя · 1/3разбор после ответа
Пользователи сами решают, обновлять ли приложение. Вы сравнили
conversion rate у обновившихся с не обновившимися и получили лучший результат у новой версии. Что здесь самая большая аналитическая проблема?Ещё вопросы по теме «Сегментация и конфаундинг»
- После запуска новой версии приложения общий `conversion rate` упал. При этом выросла доля трафика на `android` (`platform` = `android`), а у `android` исторически ниже `base rate`. Какое объяснение наиболее правдоподобно без дополнительных данных?
- Вы сравниваете `conversion rate` между `channel` = `search` и `channel` = `social`. В `channel` = `search` заметно больше пользователей из `region` с высокой платежеспособностью. Какой наиболее вероятный `confounder` и что логично использовать как `control variable`?
- Новая функция включается кнопкой, и анализ показал, что у включивших выше `retention` и `conversion rate`. Какая основная проблема такого вывода?
- В сегменте `ios` `conversion rate` вырос, и в сегменте `android` тоже вырос, но общий `conversion rate` по всем `users` снизился. Какое объяснение наиболее вероятно?
- Вы сравниваете `retention` между `region` A и `region` B. В `region` A больше пользователей из более «старых» когорт, а в `region` B — больше новых. Что корректнее сделать, чтобы сравнение было справедливым?
- Все вопросы по «Сегментация и конфаундинг» →