В наборе из 8 проверок одна метрика имеет сырой p-value=0.03, но после коррекции Holm её скорректированный p-value=0.12. Как корректнее сформулировать вывод?

AСчитать результат значимым, потому что 0.03 меньше 0.05
BСчитать результат значимым, потому что Holm всегда повышает мощность
CНе заявлять значимость при контроле FWER с Holm; можно упомянуть как сигнал, но честно указать, что после коррекции незначимо
DЗаменить метод на Benjamini–Hochberg после просмотра результата и объявить значимость
Правильный ответ. Если вы контролируете FWER с Holm, решение принимают по скорректированным p-value.

Разбор

Сырой p-value не учитывает, что вы делали несколько проверок, а Holm как раз корректирует это для контроля FWER. Если скорректированный p-value больше порога, то с точки зрения заранее выбранного правила значимость не подтверждена. Типичная ошибка — показывать только сырой p-value и умалчивать про множественность, что делает репортинг некорректным.

Проверь себя · 1/3разбор после ответа
У вас два сценария: (1) критичное решение по безопасности, (2) поиск идей среди 50 метрик для следующего спринта. Какое сочетание контроля ошибок чаще всего разумно?
Тренировать статистику в Telegram

Ещё вопросы по теме «Множественные сравнения»