В эксперименте на ранжировании пользователи разбиты на группы по `user_id`, но общий кэш поиска не учитывает вариант и иногда отдаёт пользователю выдачу другого варианта. Что это за риск?

Question

Карьерник · Accepted Answer

Правильный ответ: Загрязнение групп: пользователи получают опыт другого варианта через общий кэш, что нарушает предпосылки `SUTVA` и размывает эффект. Если инфраструктура смешивает выдачи разных вариантов, происходит загрязнение групп и эксперимент перестаёт измерять чистый эффект. Кэш, который не учитывает вариант, делает фактический показ несовпадающим с назначением по группам. Тогда часть пользователей контрольной группы увидит поведение тестового варианта или наоборот, и различия между группами размоются. Это нарушает предпосылки `SUTVA` и может скрыть реальный эффект или создать ложный. Обычно решают добавлением варианта в ключ кэша и проверкой согласованности назначения и фактического показа.

Разбор

Ещё вопросы по теме «Дизайн эксперимента и рандомизация»