Почему в корректном последовательном тестировании порог для ранней остановки обычно более строгий, чем в конце эксперимента?
AПотому что в начале эксперимента наблюдаемый эффект всегда заметно меньше, чем в конце, и для ранней остановки требуется более сильный сигнал
BПотому что рандомизация «заканчивается» только в финале теста, а до этого момента распределение пользователей по группам ещё не считается работающим
CПотому что метрика в контрольной группе считается позже, чем в тестовой группе, и это создаёт временной перекос между ранними и финальными результатами
DПотому что при нескольких промежуточных проверках нужно суммарно сохранить заданный уровень
alpha и контроль ошибки I рода для всего тестаПравильный ответ. Ранние границы делают строже, чтобы при нескольких промежуточных проверках суммарно сохранить заданный уровень
alpha и контроль ошибки I рода.Разбор
Чем раньше вы пытаетесь остановить тест, тем выше шанс случайного всплеска метрики. Если применять одинаковый порог на каждой неделе, суммарная вероятность ложноположительного результата станет больше, чем alpha. Поэтому в последовательном тестировании ранние границы требуют более сильного сигнала, а к концу становятся ближе к обычному уровню.
Проверь себя · 1/2разбор после ответа
Что такое
alpha spending в последовательном тестировании?Ещё вопросы по теме «Секвенциальное тестирование»
- Команда запускает A/B-тест и каждый день смотрит `p-value`; как только видит `p-value < alpha`, сразу завершает тест и объявляет победу. В чём главный риск такого подсматривания?
- Что лучше всего описывает правило остановки в контексте последовательного тестирования?
- Аналитик смотрит промежуточные результаты каждый день, но команда заранее зафиксировала длительность: тест идёт 14 дней, и решение принимают только по финальному анализу в конце. Что наиболее корректно про влияние такого подсматривания на ошибку первого рода для основной проверки?
- Что такое `alpha spending` в последовательном тестировании?
- Заинтересованные стороны хотят еженедельные апдейты и возможность остановить тест раньше, если уже «всё ясно». Что лучше сделать до запуска?
- Все вопросы по «Секвенциальное тестирование» →