Пользователи сами решают, обновлять ли приложение. Вы сравнили conversion rate у обновившихся с не обновившимися и получили лучший результат у новой версии. Что здесь самая большая аналитическая проблема?
AРазницы нет, потому что
segment обновившихся всегда случайныйBНужно просто увеличить выборку, и
confounder исчезнетCПроблема только в
mix shift по device, но selection bias тут невозможенDЭто
selection bias из-за self-selection: обновляются более активные users, и сравнение не причинноеПравильный ответ. Добровольное обновление создаёт
selection bias, поэтому сравнение не даёт чистый эффект версии.Разбор
Обновившиеся пользователи могут отличаться по вовлечённости, base rate покупок и устройствам. Эти различия становятся confounder и могут объяснить рост метрики без реального улучшения продукта. Чтобы оценить влияние версии, нужно сделать randomization или хотя бы сравнение like-for-like с контролем ключевых факторов.
Проверь себя · 1/3разбор после ответа
В сегменте
ios conversion rate вырос, и в сегменте android тоже вырос, но общий conversion rate по всем users снизился. Какое объяснение наиболее вероятно?Ещё вопросы по теме «Сегментация и конфаундинг»
- После запуска новой версии приложения общий `conversion rate` упал. При этом выросла доля трафика на `android` (`platform` = `android`), а у `android` исторически ниже `base rate`. Какое объяснение наиболее правдоподобно без дополнительных данных?
- Вы сравниваете `conversion rate` между `channel` = `search` и `channel` = `social`. В `channel` = `search` заметно больше пользователей из `region` с высокой платежеспособностью. Какой наиболее вероятный `confounder` и что логично использовать как `control variable`?
- Новая функция включается кнопкой, и анализ показал, что у включивших выше `retention` и `conversion rate`. Какая основная проблема такого вывода?
- В сегменте `ios` `conversion rate` вырос, и в сегменте `android` тоже вырос, но общий `conversion rate` по всем `users` снизился. Какое объяснение наиболее вероятно?
- Вы сравниваете `retention` между `region` A и `region` B. В `region` A больше пользователей из более «старых» когорт, а в `region` B — больше новых. Что корректнее сделать, чтобы сравнение было справедливым?
- Все вопросы по «Сегментация и конфаундинг» →