Почему в корректном sequential testing порог для ранней остановки обычно более строгий, чем в конце эксперимента?

AЧтобы при нескольких interim analysis суммарно сохранить заданный alpha и контроль Type I error
BПотому что в начале эксперимента effect size всегда меньше, чем в конце
CПотому что randomization «заканчивается» только в финале, а до этого не работает
DПотому что метрика в control считается позже, чем в treatment
Правильный ответ. Ранние границы делают строже, чтобы при нескольких interim analysis суммарно сохранить заданный alpha и контроль Type I error.

Разбор

Чем раньше вы пытаетесь остановить тест, тем выше шанс случайного всплеска метрики. Если применять одинаковый порог на каждой неделе, суммарная вероятность false positive станет больше, чем alpha. Поэтому в sequential testing ранние границы требуют более сильного сигнала, а к концу становятся ближе к обычному уровню.

Проверь себя · 1/3разбор после ответа
У вас нет инфраструктуры для sequential testing, но команда хочет минимизировать риски от peeking. Какой подход самый безопасный и простой?
Тренировать A/B в Telegram

Ещё вопросы по теме «Секвенциальное тестирование»