Часть пользователей не авторизована, и вы используете device_id для bucketing (разбивка пользователей на группы), а после логина появляется user_id. Что лучше сделать, чтобы один человек не увидел оба варианта при переходе в авторизованное состояние?
AНичего, смена варианта при логине не влияет на результат
BКаждый раз пересчитывать вариант от
user_id и игнорировать прошлый вариант на device_idCСвязать
device_id и user_id и закрепить вариант при первом известном идентификаторе, чтобы вариант не менялся при логинеDНазначать вариант по времени суток, тогда логин не важен
Правильный ответ. В идентификационных цепочках важно обеспечить стабильность назначения при смене идентификатора, иначе появляется contamination.
Разбор
Если до логина пользователь в одном варианте, а после логина автоматически попадает в другой, то опыт становится смешанным. Это особенно критично для метрик с окном в несколько дней и для сценариев, где пользователь может логиниться часто. Практика — хранить закрепленное назначение и переносить его при объединении device_id с user_id. Так bucketing (разбивка пользователей на группы) остается стабильным для одного человека.
Проверь себя · 1/3разбор после ответа
Есть два фактора: новый дизайн карточки и новая логика рекомендаций. Команда хочет запустить два эксперимента одновременно на одной аудитории. В каком случае разумно выбрать факторный дизайн
2x2 вместо взаимного исключения аудиторий?Ещё вопросы по теме «Дизайн эксперимента и рандомизация»
- Вы тестируете новый экран оплаты. Пользователь может заходить в приложение много раз. Метрика — конверсия в покупку за 7 дней на уровне `user_id`. Какую `unit of randomization` (единица рандомизации) выбрать, чтобы минимизировать смешение вариантов?
- Эксперимент рандомизируется по `user_id`, а вы считаете метрику на уровне `session_id` (например, длительность сессии) и сравниваете сессии как независимые наблюдения. Что здесь главное методологическое последствие?
- В тесте нового реферального механизма пользователь из `treat` отправляет приглашения друзьям, которые попадают в `control` и тоже меняют поведение. Какое допущение нарушается и почему это важно?
- Эксперимент меняет алгоритм распределения заказов между курьерами. Курьеры обслуживают сразу нескольких пользователей, и решение для одного заказа влияет на время доставки других. Какой подход к рандомизации чаще всего лучше уменьшит `interference`?
- Вы делаете `bucketing` (разбивка пользователей на группы) как `hash(user_id + day) % 2`, где `day` — текущая дата. Что самое вероятное следствие для эксперимента?
- Все вопросы по «Дизайн эксперимента и рандомизация» →