Команда сравнила среднее время доставки между регионами north и south и увидела, что в north дольше. Позже выяснилось, что в north больше заказов крупногабаритных товаров. Что здесь наиболее вероятно объясняет разницу?
AЭто смещение отбора, потому что пользователи сами выбирают регион доставки и тем самым попадают в выборку с разной скоростью логистики
BЭто значит, что смешивающий фактор полностью отсутствует, а наблюдаемая разница точно отражает качество доставки в каждом регионе
CЭто результат рандомизации заказов между регионами, поэтому спорить с разницей нельзя и нужно сразу принимать вывод о качестве
DЭто сдвиг микса по типу товара: в одном регионе доля крупногабаритных выше, поэтому нужно стратифицировать сравнение по категории товара
Правильный ответ. Разница может быть следствием сдвига микса по типу заказов, а не качества доставки в самом регионе.
Разбор
Крупногабаритные товары обычно доставляются дольше, поэтому состав заказов влияет на среднее время. Если в north доля такого сегмента выше, среднее будет хуже даже при одинаковой скорости логистики. Корректно сделать стратификацию по категории товара или сравнить заказы одинакового типа между регионами. Версии про «смещение отбора», «отсутствие смешивающего фактора» или «результат рандомизации» неверно описывают наблюдаемую ситуацию.
Проверь себя · 1/2разбор после ответа
Вы сравниваете конверсию между каналом «поиск» и каналом «соцсети». В канале «поиск» заметно больше пользователей из регионов с высокой платежеспособностью. Какой наиболее вероятный смешивающий фактор и что логично использовать как контрольную переменную?
Ещё вопросы по теме «Сегментация и конфаундинг»
- После релиза новой версии приложения общая конверсия упала. При этом выросла доля трафика на Android, у которого исторически ниже базовый уровень конверсии. Какое объяснение наиболее правдоподобно без дополнительных данных?
- Вы сравниваете конверсию между каналом «поиск» и каналом «соцсети». В канале «поиск» заметно больше пользователей из регионов с высокой платежеспособностью. Какой наиболее вероятный смешивающий фактор и что логично использовать как контрольную переменную?
- Новая функция включается кнопкой, и анализ показал, что у включивших выше удержание и конверсия. Какая основная проблема такого вывода?
- В сегменте iOS конверсия выросла, и в сегменте Android тоже выросла, но общая конверсия по всем пользователям снизилась. Какое объяснение наиболее вероятно?
- Вы сравниваете удержание между регионами A и B. В регионе A больше пользователей из более «старых» когорт, а в регионе B — больше новых. Что корректнее сделать, чтобы сравнение было справедливым?
- Все вопросы по «Сегментация и конфаундинг» →