Стейкхолдеры хотят еженедельные апдейты и возможность остановить тест раньше, если уже «всё ясно». Что лучше сделать до запуска?

AСмотреть результаты каждый день и остановить, как только станет p-value < alpha, без дополнительных правил
BЗаранее описать stopping rule, расписание interim analysis и использовать sequential testing с alpha spending.
CЗапустить тот же тест несколько раз подряд и выбрать самый удачный результат
DПовысить alpha, чтобы быстрее получить значимость и сократить риски
Правильный ответ. Если нужны промежуточные решения, заранее задайте stopping rule и используйте корректный sequential testing.

Разбор

Ад-хок остановка по первому p-value < alpha превращает процесс в peeking и повышает false positive. Лучше заранее определить моменты interim analysis и границы для принятия решения. Тогда alpha spending распределит риск ошибки по проверкам, и ранняя остановка будет статистически корректной.

Проверь себя · 1/3разбор после ответа
Если вы заранее знаете, что будете делать 5 проверок одной метрики, какой простой консервативный способ контролировать общий alpha можно использовать, если нет полноценного alpha spending?
Тренировать A/B в Telegram

Ещё вопросы по теме «Секвенциальное тестирование»