Команда сравнила среднее время доставки между region north и region south и увидела, что в north дольше. Позже выяснилось, что в north больше заказов крупногабаритных товаров. Что здесь наиболее вероятно объясняет разницу?

AЭто selection bias, потому что users выбирают region
BЭто значит, что confounder отсутствует и вывод точный
CЭто результат randomization, поэтому спорить нельзя
DЭто сдвиг микса по segment типа товара, поэтому нужно контролировать product category как control variable
Правильный ответ. Разница может быть следствием сдвиг микса по segment типов заказов, а не качества доставки в region.

Разбор

Крупногабаритные товары обычно доставляются дольше, поэтому состав заказов влияет на среднее время. Если в north доля такого segment выше, среднее будет хуже даже при одинаковой скорости логистики. Корректно сделать stratification по product category или сравнить like-for-like внутри одинаковых типов товаров.

Проверь себя · 1/3разбор после ответа
После запуска новой версии приложения общий conversion rate упал. При этом выросла доля трафика на android (platform = android), а у android исторически ниже base rate. Какое объяснение наиболее правдоподобно без дополнительных данных?
Открыть Карьерник в Telegram

Ещё вопросы по теме «Сегментация и конфаундинг»