Вы делаете разбивку пользователей на группы как `hash(user_id + day) % 2`, где `day` — текущая дата. Что самое вероятное следствие для эксперимента?

Question

Карьерник · Accepted Answer

Правильный ответ: Один и тот же `user_id` будет перескакивать между вариантами по дням, что приведёт к смешиванию воздействий. Разбивка на группы должна быть детерминированной и стабильной во времени для одного `user_id`, иначе пользователь увидит разные варианты. Добавление `day` в ключ делает назначение зависимым от даты, поэтому один и тот же пользователь будет получать разные варианты в разные дни. В результате внутри одного `user_id` происходит смена воздействия, и эффект размывается. Кроме того, такая схема усложняет анализ по когортам и повышает риск непредсказуемых перекосов в данных.

Вы делаете разбивку пользователей на группы как `hash(user_id + day) % 2`, где `day` — текущая дата. Что самое вероятное следствие для эксперимента?

Разбор

Ещё вопросы по теме «Дизайн эксперимента и рандомизация»

Вы делаете разбивку пользователей на группы как hash(user_id + day) % 2, где day — текущая дата. Что самое вероятное следствие для эксперимента?

Разбор

Ещё вопросы по теме «Дизайн эксперимента и рандомизация»

Вы делаете разбивку пользователей на группы как `hash(user_id + day) % 2`, где `day` — текущая дата. Что самое вероятное следствие для эксперимента?