В эксперименте на ранжировании вы используете `bucketing` (разбивка пользователей на группы) по `user_id`, но кэш результатов поиска настроен без учета варианта и иногда отдает пользователю выдачу, посчитанную для другого варианта. Что это за риск?

Question

Карьерник · Accepted Answer

Правильный ответ: Только снижение скорости системы, на корректность эксперимента это не влияет. Если инфраструктура смешивает ответы разных вариантов, происходит contamination и эксперимент перестает измерять чистый эффект. Кэш, который не учитывает вариант, делает фактическую экспозицию несовпадающей с назначением по `bucketing` (разбивка пользователей на группы). Тогда часть пользователей из `control` увидит поведение `treat` или наоборот, и различия между группами размоются. Это нарушает предпосылки дизайна и может скрыть реальный эффект или создать ложный. Обычно решают добавлением варианта в ключ кэша и проверкой консистентности назначения и экспозиции.

Разбор

Ещё вопросы по теме «Дизайн эксперимента и рандомизация»