Вы делаете A/B/n с 1 контролем и 12 вариантами креатива, цель — отобрать несколько перспективных кандидатов для следующего подтверждающего теста. Какой подход к множественным проверкам чаще соответствует этой цели?
AЖёсткий
Bonferroni, чтобы ни один кандидат не был ложным.BИгнорировать
multiple comparisons, чтобы не терять мощность.CКонтроль
FDR (например, Benjamini–Hochberg), чтобы ограничить ожидаемую долю false positives среди отобранных кандидатов.DПовысить
alpha, чтобы отобрать больше кандидатов.Правильный ответ. Для отбора кандидатов в поисковой фазе часто используют
FDR, чтобы балансировать между находками и долей false positives.Разбор
В поисковой задаче обычно важнее не пропустить перспективные варианты, чем полностью исключить одну ложную находку. FDR даёт больше мощности при большом числе сравнений и задаёт понятный контроль качества shortlist. Затем shortlist подтверждают отдельным экспериментом или более строгой процедурой.
Проверь себя · 1/3разбор после ответа
В одном эксперименте вы смотрите 25 продуктовых метрик и хотите составить список метрик, которые стоит изучить глубже, понимая что часть сигналов может оказаться ложной. Какую коррекцию чаще выбирают и почему?
Ещё вопросы по теме «Множественное тестирование»
- Вы запускаете `A/B/n`-эксперимент: контроль и 3 варианта интерфейса. Что принципиально меняется по сравнению с `A/B` в части риска `false positives`, если проверять каждое сравнение на `alpha` 0.05 без коррекции?
- В `A/B/n` у вас контроль A и варианты B и C, и вы хотите выбрать любой вариант, который статистически лучше контроля по одной основной метрике. Какие проверки логично считать одной семьёй для коррекции `multiple comparisons`?
- Команда сравнивает 8 вариантов с контролем и для каждого теста использует `alpha` 0.05 без коррекции. Что происходит с вероятностью получить хотя бы один `false positives` среди всех сравнений?
- Что означает контроль `family-wise error` (суммарная ошибка первого рода) в задаче `multiple comparisons`?
- Какое утверждение верно про коррекцию `Bonferroni` при `multiple comparisons`?
- Все вопросы по «Множественное тестирование» →