У вас нет инфраструктуры для последовательного тестирования, но команда хочет минимизировать риски от подглядывания в промежуточные результаты. Какой подход самый безопасный и простой?

Question

Карьерник · Accepted Answer

Правильный ответ: Заранее зафиксировать длительность теста и делать один финальный анализ, не останавливая тест по промежуточным `p-value`. Самый простой способ избежать подглядывания — фиксированная длительность теста и один финальный анализ; ежедневно можно мониторить только страховочные метрики и sanity-checkи. Вы заранее задаёте длительность теста и критерий решения, а затем оцениваете результат один раз в конце. Это сохраняет стандартную интерпретацию `p-value` и контроль ошибки I рода. Если нужен ежедневный контроль качества, можно мониторить страховочные метрики, но не менять решение по основной метрике до финала.

Разбор

Ещё вопросы по теме «Секвенциальное тестирование»