Вы тестируете 1 контроль и 12 вариантов креатива; цель — отобрать несколько перспективных кандидатов для следующего подтверждающего теста. Какой подход к множественным сравнениям чаще соответствует этой цели?
AПрименить жёсткий
Bonferroni к 12 сравнениям, чтобы среди отобранных кандидатов почти не оказалось ложных находокBКонтролировать
FDR через процедуру Benjamini–Hochberg, чтобы ограничить ожидаемую долю ложных открытий среди кандидатовCПолностью игнорировать поправку на множественные сравнения, чтобы не терять мощность при отборе перспективных вариантов
DПовысить
alpha до 0.2 на этапе отбора, чтобы пройти проверку могло больше вариантов и список кандидатов стал ширеПравильный ответ. Для отбора кандидатов в поисковой фазе часто используют контроль
FDR, чтобы балансировать находки и долю ложных открытий.Разбор
В поисковой задаче обычно важнее не пропустить перспективные варианты, чем полностью исключить одну ложную находку. Контроль FDR даёт больше мощности при большом числе сравнений и задаёт понятный контроль качества короткого списка. Затем отобранные варианты подтверждают отдельным экспериментом или более строгой процедурой типа Bonferroni на финальной фазе.
Проверь себя · 1/3разбор после ответа
Вы настроили контроль FDR (доля ложных открытий) на уровне 0.1 и после процедуры Бенджамини–Хохберга получили 20 значимых сравнений. Как корректнее интерпретировать это число?
Ещё вопросы по теме «Множественное тестирование»
- Вы запускаете `A/B/n`-эксперимент: контроль и 3 варианта интерфейса. Что принципиально меняется по сравнению с `A/B` в части риска ложноположительных результатов, если проверять каждое сравнение на `alpha` 0.05 без коррекции?
- В эксперименте `A/B/n` у вас контроль A и варианты B и C, и вы готовы запустить любой вариант, который статистически лучше контроля по одной основной метрике. Какие проверки логично считать одной семьёй для поправки на множественные сравнения?
- Команда сравнивает 8 вариантов с контролем и для каждого теста использует порог `alpha = 0.05` без коррекции. Что происходит с вероятностью получить хотя бы одно ложное срабатывание среди всех сравнений?
- Что означает контроль `FWER` (вероятности хотя бы одной ошибки I рода) в задаче с множественными сравнениями?
- Какое утверждение верно про коррекцию `Bonferroni` при множественных сравнениях?
- Все вопросы по «Множественное тестирование» →