Вы делаете `bucketing` (разбивка пользователей на группы) как `hash(user_id + day) % 2`, где `day` — текущая дата. Что самое вероятное следствие для эксперимента?

Question

Карьерник · Accepted Answer

Правильный ответ: Один и тот же `user_id` будет перескакивать между вариантами по дням, создавая contamination. `bucketing` (разбивка пользователей на группы) должен быть детерминированным и стабильным во времени для одного `user_id`, иначе пользователь увидит разные варианты. Добавление `day` в ключ делает назначение зависимым от даты, поэтому один и тот же пользователь будет получать разные варианты в разные дни. В результате внутри одного `user_id` происходит смена лечения, и эффект размывается. Кроме того, такая схема усложняет анализ по когортам и повышает риск непредсказуемых перекосов в данных.

Вы делаете `bucketing` (разбивка пользователей на группы) как `hash(user_id + day) % 2`, где `day` — текущая дата. Что самое вероятное следствие для эксперимента?

Разбор

Ещё вопросы по теме «Дизайн эксперимента и рандомизация»

Вы делаете bucketing (разбивка пользователей на группы) как hash(user_id + day) % 2, где day — текущая дата. Что самое вероятное следствие для эксперимента?

Разбор

Ещё вопросы по теме «Дизайн эксперимента и рандомизация»

Вы делаете `bucketing` (разбивка пользователей на группы) как `hash(user_id + day) % 2`, где `day` — текущая дата. Что самое вероятное следствие для эксперимента?