В чём ключевое отличие «просто peeking в дашборд» от корректного sequential testing?

ASequential testing запрещает смотреть результаты до конца, а peeking разрешает
BSequential testing заранее задаёт stopping rule и границы (например, через alpha spending), а peeking обычно не имеет корректных правил остановки
CPeeking требует больше трафика, чем sequential testing, поэтому он хуже
DSequential testing работает только без randomization, иначе он не нужен
Правильный ответ. В sequential testing заранее фиксируют interim analysis, stopping rule и распределение alpha; при обычном peeking этих правил нет.

Разбор

В sequential testing заранее фиксируют моменты interim analysis, критерии остановки и то, как расходуется alpha. Благодаря этому сохраняется контроль Type I error. При обычном peeking команда часто останавливается при первом «значимом» дне, что превращается в optional stopping.

Проверь себя · 1/3разбор после ответа
В эксперименте вы делали ежедневные проверки. На 3-й день получили p-value < alpha и остановили тест, но позже выяснилось, что при продолжении до 14 дней результат стал бы незначимым. Какое объяснение наиболее вероятно?
Тренировать A/B в Telegram

Ещё вопросы по теме «Секвенциальное тестирование»