Система мониторинга каждый день проверяет 50 метрик и отправляет алерт при p-value < 0.05. Что поможет снизить число ложных алертов из-за множественных проверок, сохранив чувствительность?

AПоднять порог до alpha = 0.2, чтобы алерты были чаще и быстрее
BКонтролировать FDR для дневного набора проверок, например через Benjamini–Hochberg, и явно фиксировать семейство тестов
CОставить всё как есть: если p-value < 0.05, алерт всегда корректен
DОтключить все метрики кроме одной, чтобы не было multiple comparisons
Правильный ответ. При большом числе ежедневных проверок полезно контролировать множественность, например через FDR.

Разбор

Когда вы проверяете десятки метрик, шанс случайного p-value < 0.05 в любой из них заметно возрастает, и алерты становятся шумными. Контроль FDR помогает держать долю ложных срабатываний среди поднятых алертов на приемлемом уровне. Типичная ошибка — интерпретировать каждое срабатывание как отдельное событие, забывая, что вы запускаете сразу много тестов ежедневно.

Проверь себя · 1/3разбор после ответа
Вы проверяете эффект фичи на 5 сегментах и 2 платформах и планируете в презентации выбрать самые 'успешные' результаты. Что разумнее всего считать семейством тестов для контроля FWER?
Тренировать статистику в Telegram

Ещё вопросы по теме «Множественные сравнения»