В эксперименте может вырасти crash_rate, поэтому команда хочет иметь возможность остановить тест при ухудшении, не повышая false positive по основной метрике. Что лучше сделать?

AОстановить тест, как только кому-то «показалось», что стало хуже, без формальных критериев
BЗаранее задать stopping rule для guardrail (защитная метрика) и использовать корректный подход к промежуточным решениям (например, sequential testing/alpha spending).
CНе смотреть crash_rate до конца, чтобы не было peeking
DСразу перевести 100% трафика в treatment, чтобы быстрее понять, что происходит
Правильный ответ. Для ранней остановки по рискам нужен заранее заданный stopping rule и корректный подход к промежуточным решениям.

Разбор

Если останавливать тест по «ощущениям», вы получите неуправляемое число ложных тревог. Лучше заранее определить, какие guardrail (защитная метрика) метрики мониторим и при каких условиях выключаем treatment. Для основной метрики используйте fixed horizon или alpha spending в sequential testing, чтобы не наращивать Type I error.

Проверь себя · 1/3разбор после ответа
Что лучше всего описывает stopping rule в контексте sequential testing?
Тренировать A/B в Telegram

Ещё вопросы по теме «Секвенциальное тестирование»