В продукте запустили опрос удовлетворённости. В segment device desktop отвечает заметно больше users, чем в segment device mobile, и отвечают в основном самые активные. Какой риск для сравнения результатов между segment?
AРиска нет, потому что опрос автоматически делает
randomizationBЭто чистый
сдвиг микса, который всегда повышает точностьCЭто
selection bias: ответы не репрезентативны для всего segment, поэтому сравнение может быть искаженоDНужно просто заменить метрику на
conversion rate, и selection bias исчезнетПравильный ответ. Если отвечают неслучайные
users, возникает selection bias и результаты по segment могут быть искажены.Разбор
Опрос отражает не всю аудиторию, а подмножество, которое само решило ответить, то есть есть self-selection. Если доля ответивших различается между segment, сравнение становится нечестным. Чтобы снизить проблему, полезно следить за репрезентативностью и анализировать влияние участия в опросе как control variable.
Проверь себя · 1/3разбор после ответа
Новая функция включается кнопкой, и анализ показал, что у включивших выше
retention и conversion rate. Какая основная проблема такого вывода?Ещё вопросы по теме «Сегментация и конфаундинг»
- После запуска новой версии приложения общий `conversion rate` упал. При этом выросла доля трафика на `android` (`platform` = `android`), а у `android` исторически ниже `base rate`. Какое объяснение наиболее правдоподобно без дополнительных данных?
- Вы сравниваете `conversion rate` между `channel` = `search` и `channel` = `social`. В `channel` = `search` заметно больше пользователей из `region` с высокой платежеспособностью. Какой наиболее вероятный `confounder` и что логично использовать как `control variable`?
- Новая функция включается кнопкой, и анализ показал, что у включивших выше `retention` и `conversion rate`. Какая основная проблема такого вывода?
- В сегменте `ios` `conversion rate` вырос, и в сегменте `android` тоже вырос, но общий `conversion rate` по всем `users` снизился. Какое объяснение наиболее вероятно?
- Вы сравниваете `retention` между `region` A и `region` B. В `region` A больше пользователей из более «старых» когорт, а в `region` B — больше новых. Что корректнее сделать, чтобы сравнение было справедливым?
- Все вопросы по «Сегментация и конфаундинг» →