Вы тестируете новый алгоритм рекомендаций для части пользователей. В тестовой группе товар распродаётся быстрее, из-за чего пользователи из контрольной группы чаще видят сообщение «Нет в наличии». Как лучше всего описать эту проблему?

Question

Карьерник · Accepted Answer

Правильный ответ: Это нарушение `SUTVA` и взаимовлияние групп через общий инвентарь: исход в контроле зависит от назначения в тест.. Когда поведение одной группы влияет на ресурсы другой, нарушается допущение `SUTVA` и эффект чистого варианта оценить нельзя. `SUTVA` (Stable Unit Treatment Value Assumption) предполагает, что исход у каждого пользователя зависит только от его собственного назначения. Если в тестовой группе быстрее распродаётся товар, контролю достаются худшие позиции — на исход контрольной группы напрямую повлияло то, что произошло в тесте. Это не `SRM` (там перекошены доли пользователей по группам), не «обычный шум» и не баг хеша: это структурное взаимовлияние через общий инвентарь, которое лечится изоляцией ресурсов между группами или специальными дизайнами эксперимента.

Разбор

Ещё вопросы по теме «Дизайн эксперимента и рандомизация»