Команда смотрит результаты каждый день и останавливает эксперимент, как только видит p-value

Question

Команда смотрит результаты каждый день и останавливает эксперимент, как только видит p-value < 0.05. Какой основной риск такого подхода?

Карьерник · Accepted Answer

Правильный ответ: Увеличивается вероятность ложноположительных выводов из-за множественных проверок без правил остановки. Частые проверки и остановка «как только стало значимо» (optional stopping) увеличивают риск ложноположительных выводов без корректного sequential-дизайна. Если останавливать тест при первом «красивом» p-value, вы фактически делаете много попыток найти значимость. Это ведёт к завышенной доле ложноположительных результатов и нестабильным решениям. Лучше заранее определить длительность, критерии остановки или использовать корректные последовательные методы.

Команда смотрит результаты каждый день и останавливает эксперимент, как только видит p-value < 0.05. Какой основной риск такого подхода?

Разбор

Ещё вопросы по теме «QA, SRM и раскатка»