Вы протестировали 12 сегментов и применили Holm для контроля FWER. Какой вариант репортинга наиболее корректен?

AПишем только сегменты с p-value < 0.05 и не упоминаем остальные проверки
BПишем, что применили Holm, значит p-value теперь равен вероятности H0
CПишем, что было 12 проверок, использовали Holm при alpha = 0.05, и значимыми считаем только результаты со скорректированным p-value < 0.05
DПишем, что коррекция была, но число проверок не указываем, чтобы не усложнять
Правильный ответ. Корректный отчёт явно фиксирует семейство тестов, метод поправки и правило принятия решений.

Разбор

При множественных проверках важно указать, сколько гипотез тестировали и какой метод использовали (Holm, Bonferroni или Benjamini–Hochberg). Также важно сказать, какой порог применяли и что именно считается значимым после коррекции. Типичная ошибка — показывать только «красивые» сегменты без контекста multiple comparisons, что завышает уверенность в выводах.

Проверь себя · 1/3разбор после ответа
В A/B-тесте вы измеряете 15 метрик и объявляете победу, если хоть одна метрика имеет p-value < 0.05. Какой риск вы в первую очередь раздуваете?
Тренировать статистику в Telegram

Ещё вопросы по теме «Множественные сравнения»