В эксперименте A/B/n у вас контроль A и варианты B и C, и вы готовы запустить любой вариант, который статистически лучше контроля по одной основной метрике. Какие проверки логично считать одной семьёй для поправки на множественные сравнения?
AТолько сравнение варианта, который оказался лучшим по приросту метрики, против контроля без учёта остальных вариантов
BСравнения варианта B против A и варианта C против A, потому что любое из них может привести к решению о запуске нового варианта
CТолько сравнение варианта B против варианта C, потому что внутри эксперимента варианты конкурируют между собой за запуск
DПоправка на множественные сравнения здесь не нужна, потому что измеряется одна и та же основная метрика во всех сравнениях
Правильный ответ. Семья гипотез определяется решениями, которые вы планируете принимать, и в
A/B/n обычно включает все плановые сравнения с контролем.Разбор
Если вы готовы запустить любой вариант, который обгонит контроль, то фактически у вас несколько шансов «победить» контроль. Поэтому сравнения B против A и C против A нужно учитывать совместно. Иначе вы будете недооценивать риск ложноположительных решений на уровне всего эксперимента и принимать невыгодные запуски чаще, чем подразумевает заявленный уровень значимости.
Проверь себя · 1/3разбор после ответа
Что описывает контроль
FDR в процедурах вроде Benjamini–Hochberg?Ещё вопросы по теме «Множественное тестирование»
- Вы запускаете `A/B/n`-эксперимент: контроль и 3 варианта интерфейса. Что принципиально меняется по сравнению с `A/B` в части риска ложноположительных результатов, если проверять каждое сравнение на `alpha` 0.05 без коррекции?
- Команда сравнивает 8 вариантов с контролем и для каждого теста использует порог `alpha = 0.05` без коррекции. Что происходит с вероятностью получить хотя бы одно ложное срабатывание среди всех сравнений?
- Что означает контроль `FWER` (вероятности хотя бы одной ошибки I рода) в задаче с множественными сравнениями?
- Какое утверждение верно про коррекцию `Bonferroni` при множественных сравнениях?
- Чем процедура Холма чаще всего отличается от процедуры Бонферрони, если цель та же — контроль общей вероятности ошибки первого рода в семье проверок?
- Все вопросы по «Множественное тестирование» →