Эксперимент рассчитан только на новых пользователей. Критерий «новый пользователь» пересчитывается каждый день из-за особенностей `ETL`, и часть пользователей может внезапно перестать удовлетворять этому критерию в середине эксперимента. Какой риск самый существенный и как его снизить?

Question

Карьерник · Accepted Answer

Правильный ответ: Селекция и несопоставимость групп из-за динамической принадлежности к сегменту: фиксируйте принадлежность по `user_id` на момент назначения. Сегмент, зависящий от времени или данных после старта, может привести к выборочной потере пользователей и несопоставимости групп. Если пользователь может внезапно перестать удовлетворять критерию, вы фактически меняете состав выборки по ходу эксперимента. Это может происходить неодинаково в тестовой и контрольной группах, особенно если продуктовые изменения влияют на события, из которых строится сегмент. В результате сравнение становится смещённым и плохо интерпретируемым. Надёжный приём — фиксировать принадлежность к сегменту на момент назначения по `user_id` и анализировать по этому фиксированному признаку.

Разбор

Ещё вопросы по теме «Дизайн эксперимента и рандомизация»