В эксперименте вы делали ежедневные проверки. На 3-й день получили p-value < alpha и остановили тест, но позже выяснилось, что при продолжении до 14 дней результат стал бы незначимым. Какое объяснение наиболее вероятно?

AСработала случайная флуктуация, а peeking с optional stopping «поймал» шум как эффект
BRandomization сломалась ровно на 4-й день, поэтому результат поменялся
CКоманда перепутала control и treatment, поэтому значимость пропала
DAlpha spending автоматически уменьшило effect size задним числом
Правильный ответ. Вероятнее всего это случайная флуктуация: peeking и ранняя остановка «поймали» шум, который исчез при бы продолжении.

Разбор

В начале теста дисперсия высока, и метрика может случайно отклониться. Если остановить эксперимент в момент такого отклонения, вы фиксируете шум как effect size. При продолжении теста результат обычно усредняется и становится более стабильным. Поэтому важно использовать fixed horizon или корректные границы в sequential testing.

Проверь себя · 1/3разбор после ответа
У вас нет инфраструктуры для sequential testing, но команда хочет минимизировать риски от peeking. Какой подход самый безопасный и простой?
Тренировать A/B в Telegram

Ещё вопросы по теме «Секвенциальное тестирование»