В A/B-тесте вы измеряете 15 метрик и объявляете победу, если хоть одна метрика имеет p-value < 0.05. Какой риск вы в первую очередь раздуваете?

AFWER: вероятность хотя бы одной ложной находки среди 15 метрик
BFDR: вероятность хотя бы одной ложной находки среди 15 метрик
CРиск ложной находки уменьшается, потому что метрик больше
DBenjamini–Hochberg автоматически применяется, раз метрик много
Правильный ответ. Правило 'победа, если хоть где-то значимо' напрямую раздувает FWER.

Разбор

Когда вы разрешаете любому из 15 тестов стать основанием для решения, вы фактически увеличиваете шанс случайной 'победы'. Это и есть рост FWER, то есть вероятности хотя бы одной ложной находки в семействе проверок. Типичная ошибка — думать, что раз каждый тест на 0.05, то общий риск тоже 0.05.

Проверь себя · 1/3разбор после ответа
Вы применяете процедуру Benjamini–Hochberg для контроля FDR на уровне 0.05 к 5 проверкам с отсортированными p-value: 0.004, 0.012, 0.018, 0.07, 0.2. Сколько гипотез будет отклонено?
Тренировать статистику в Telegram

Ещё вопросы по теме «Множественные сравнения»