Команда сравнила среднее время доставки между region north и region south и увидела, что в north дольше. Позже выяснилось, что в north больше заказов крупногабаритных товаров. Что здесь наиболее вероятно объясняет разницу?
AЭто
selection bias, потому что users выбирают regionBЭто значит, что
confounder отсутствует и вывод точныйCЭто результат
randomization, поэтому спорить нельзяDЭто
сдвиг микса по segment типа товара, поэтому нужно контролировать product category как control variableПравильный ответ. Разница может быть следствием
сдвиг микса по segment типов заказов, а не качества доставки в region.Разбор
Крупногабаритные товары обычно доставляются дольше, поэтому состав заказов влияет на среднее время. Если в north доля такого segment выше, среднее будет хуже даже при одинаковой скорости логистики. Корректно сделать stratification по product category или сравнить like-for-like внутри одинаковых типов товаров.
Проверь себя · 1/3разбор после ответа
После запуска новой версии приложения общий
conversion rate упал. При этом выросла доля трафика на android (platform = android), а у android исторически ниже base rate. Какое объяснение наиболее правдоподобно без дополнительных данных?Ещё вопросы по теме «Сегментация и конфаундинг»
- После запуска новой версии приложения общий `conversion rate` упал. При этом выросла доля трафика на `android` (`platform` = `android`), а у `android` исторически ниже `base rate`. Какое объяснение наиболее правдоподобно без дополнительных данных?
- Вы сравниваете `conversion rate` между `channel` = `search` и `channel` = `social`. В `channel` = `search` заметно больше пользователей из `region` с высокой платежеспособностью. Какой наиболее вероятный `confounder` и что логично использовать как `control variable`?
- Новая функция включается кнопкой, и анализ показал, что у включивших выше `retention` и `conversion rate`. Какая основная проблема такого вывода?
- В сегменте `ios` `conversion rate` вырос, и в сегменте `android` тоже вырос, но общий `conversion rate` по всем `users` снизился. Какое объяснение наиболее вероятно?
- Вы сравниваете `retention` между `region` A и `region` B. В `region` A больше пользователей из более «старых» когорт, а в `region` B — больше новых. Что корректнее сделать, чтобы сравнение было справедливым?
- Все вопросы по «Сегментация и конфаундинг» →