Команда получила `p-value` = 0.07 при заранее заявленном уровне значимости 0.05 и предлагает поднять его до 0.10, чтобы объявить результат значимым. Почему это плохая практика?

Question

Карьерник · Accepted Answer

Правильный ответ: Уровень значимости нужно фиксировать до анализа данных, иначе растёт риск ошибки I рода и выводы становятся недостоверными. Уровень значимости выбирают до просмотра данных, иначе возрастает риск ложноположительных результатов. Уровень значимости `α` фиксируется до анализа данных и не двигается под результат, иначе фактическая частота ошибок I рода превышает заявленную. Это классическая практика `p-hacking`: когда пороги подгоняют под наблюдаемый `p-value`, реальная вероятность ложного срабатывания оказывается значительно выше декларируемой. Уровень значимости 0.10 в принципе допустим в некоторых задачах (например, в скрининговых исследованиях), просто его нужно объявить заранее. Ни ошибка II рода, ни сам `p-value` от пересмотра порога не пересчитываются автоматически.

Разбор

Ещё вопросы по теме «Основы проверки гипотез»