Команда сравнила среднее время доставки между `region` north и `region` south и увидела, что в north дольше. Позже выяснилось, что в north больше заказов крупногабаритных товаров. Что здесь наиболее вероятно объясняет разницу?

Question

Карьерник · Accepted Answer

Правильный ответ: Это `selection bias`, потому что `users` выбирают `region`. Разница может быть следствием `сдвиг микса` по `segment` типов заказов, а не качества доставки в `region`. Крупногабаритные товары обычно доставляются дольше, поэтому состав заказов влияет на среднее время. Если в north доля такого `segment` выше, среднее будет хуже даже при одинаковой скорости логистики. Корректно сделать `stratification` по `product category` или сравнить `like-for-like` внутри одинаковых типов товаров.

Разбор

Ещё вопросы по теме «Сегментация и конфаундинг»