Эксперимент рассчитан только на новых пользователей. Критерий «новый пользователь» пересчитывается каждый день из-за особенностей ETL, и часть пользователей может внезапно перестать удовлетворять этому критерию в середине эксперимента. Какой риск самый существенный и как его снизить?

AРиска нет, потому что сегментация не влияет на рандомизацию
BЕдинственный риск — уменьшение размера выборки, смещения не бывает
CДостаточно увеличить долю treat, чтобы компенсировать потери пользователей
DСелекция и несопоставимость групп из-за динамической eligibility, поэтому нужно фиксировать принадлежность к сегменту при назначении и не пересчитывать ее в ходе эксперимента
Правильный ответ. Сегмент, зависящий от времени или данных после старта, может привести к выборочной потере пользователей и несопоставимости групп.

Разбор

Если пользователь может внезапно перестать удовлетворять критерию, вы фактически меняете состав выборки по ходу эксперимента. Это может происходить неодинаково в treat и control, особенно если продуктовые изменения влияют на события, из которых строится сегмент. В результате сравнение становится смещенным и плохо интерпретируемым. Надежный прием — фиксировать eligibility на момент назначения по user_id и анализировать по этому фиксированному признаку.

Проверь себя · 1/3разбор после ответа
Есть два фактора: новый дизайн карточки и новая логика рекомендаций. Команда хочет запустить два эксперимента одновременно на одной аудитории. В каком случае разумно выбрать факторный дизайн 2x2 вместо взаимного исключения аудиторий?
Тренировать A/B в Telegram

Ещё вопросы по теме «Дизайн эксперимента и рандомизация»