Заинтересованные стороны хотят еженедельные апдейты и возможность остановить тест раньше, если уже «всё ясно». Что лучше сделать до запуска?

AСмотреть результаты каждый день и остановить тест, как только впервые станет p-value < alpha, без заранее описанных правил последовательного анализа
BЗаранее описать правило остановки, расписание промежуточных проверок и использовать последовательный анализ со схемой расхода значимости alpha
CЗапустить один и тот же тест несколько раз подряд на разных неделях и выбрать самый удачный результат для финального отчёта заинтересованным сторонам
DПовысить уровень значимости alpha до более мягкого порога, чтобы быстрее получить значимый результат и сократить время до решения о раскатке
Правильный ответ. Если нужны промежуточные решения, заранее задайте правило остановки и используйте корректный последовательный анализ.

Разбор

Ад-хок остановка по первому p-value < alpha превращает процесс в подглядывание и повышает долю ложноположительных результатов. Лучше заранее определить моменты промежуточных проверок и границы для принятия решения. Тогда схема расхода значимости распределит риск ошибки по проверкам, и ранняя остановка будет статистически корректной. Перезапуски того же теста и смягчение alpha лишь увеличивают вероятность ложного эффекта без фактического роста качества решений.

Проверь себя · 1/2разбор после ответа
Что такое alpha spending в последовательном тестировании?
Тренировать A/B в Telegram

Ещё вопросы по теме «Секвенциальное тестирование»