В эксперименте вы делали ежедневные проверки. На 3-й день получили `p-value

Question

В эксперименте вы делали ежедневные проверки. На 3-й день получили `p-value < alpha` и остановили тест, но позже выяснилось, что при продолжении до 14 дней результат стал бы незначимым. Какое объяснение наиболее вероятно?

Карьерник · Accepted Answer

Правильный ответ: Сработала случайная флуктуация, а ежедневные подглядывания и опциональная остановка «поймали» шум как эффект. Скорее всего это случайная флуктуация: подглядывания и ранняя остановка зафиксировали шум, который ушёл бы при продолжении. В начале теста дисперсия высока, и метрика может случайно отклониться. Если остановить эксперимент в момент такого отклонения, вы фиксируете шум как реальный размер эффекта. При продолжении теста результат обычно усредняется и становится более стабильным. Поэтому важно использовать фиксированный горизонт или корректные границы последовательного тестирования.

Разбор

Ещё вопросы по теме «Секвенциальное тестирование»