Вы заранее определили одну основную метрику успеха, но после эксперимента дополнительно посмотрели ещё 10 вторичных метрик. Как корректнее всего оформить принятие решения?

Question

Карьерник · Accepted Answer

Правильный ответ: Принимать решение по заранее заданной основной метрике, остальные пометить как вторичные и при необходимости применять поправки. Заранее заданная основная метрика снижает риск ошибок из-за множественных сравнений. Корректная практика — заранее зафиксировать одну (или несколько) основную метрику и принимать решение по ней; остальные метрики идут как вторичные и используются для понимания механизма эффекта, причём по ним применяют поправку на множественность. Выбор основной метрики постфактум по минимальному `p-value` — типичный `cherry-picking`. Стратегия «хоть одна значима без поправок» прямо раздувает `FWER`. Усреднение `p-value` не имеет статистического обоснования — это не валидная процедура комбинирования тестов.

Разбор

Ещё вопросы по теме «Множественные сравнения»