Маркетплейс: тест меняет ранжирование для покупателей в treat, что увеличивает показы и продажи некоторых продавцов. Эти продавцы затем меняют цену или наличие, и это влияет на покупателей из control. Какой вывод наиболее корректен?
AЭто чистый эффект,
SUTVA (Stable Unit Treatment Value Assumption) выполнено, потому что рандомизация по user_id корректнаBЭто
SRM (Sample Ratio Mismatch), потому что продавцы меняют цены, а значит группы стали неравнымиCДостаточно увеличить выборку, и проблема исчезнет
DЭто
interference между сторонами рынка, и может потребоваться другая unit of randomization (единица рандомизации) или дизайн, учитывающий двусторонние spilloversПравильный ответ. На двусторонних рынках часто нарушается
SUTVA (Stable Unit Treatment Value Assumption), потому что лечение одной стороны меняет среду для другой.Разбор
Даже при корректном bucketing (разбивка пользователей на группы) по user_id изменения у покупателей могут менять стимулы и поведение продавцов. Эти изменения затем возвращаются в виде другой среды и для пользователей из control, создавая spillovers. В такой ситуации простое сравнение групп может не отражать изолированный эффект и требует осторожной интерпретации. Возможны альтернативы: рандомизация по рынку, категории или времени, а также дизайны, которые явно учитывают взаимодействие сторон. Главное — заранее признать риск interference и выбирать дизайн под структуру системы.
Проверь себя · 1/3разбор после ответа
Вы делаете
bucketing (разбивка пользователей на группы) как hash(user_id + day) % 2, где day — текущая дата. Что самое вероятное следствие для эксперимента?Ещё вопросы по теме «Дизайн эксперимента и рандомизация»
- Вы тестируете новый экран оплаты. Пользователь может заходить в приложение много раз. Метрика — конверсия в покупку за 7 дней на уровне `user_id`. Какую `unit of randomization` (единица рандомизации) выбрать, чтобы минимизировать смешение вариантов?
- Эксперимент рандомизируется по `user_id`, а вы считаете метрику на уровне `session_id` (например, длительность сессии) и сравниваете сессии как независимые наблюдения. Что здесь главное методологическое последствие?
- В тесте нового реферального механизма пользователь из `treat` отправляет приглашения друзьям, которые попадают в `control` и тоже меняют поведение. Какое допущение нарушается и почему это важно?
- Эксперимент меняет алгоритм распределения заказов между курьерами. Курьеры обслуживают сразу нескольких пользователей, и решение для одного заказа влияет на время доставки других. Какой подход к рандомизации чаще всего лучше уменьшит `interference`?
- Вы делаете `bucketing` (разбивка пользователей на группы) как `hash(user_id + day) % 2`, где `day` — текущая дата. Что самое вероятное следствие для эксперимента?
- Все вопросы по «Дизайн эксперимента и рандомизация» →