Что лучше всего описывает правило остановки в контексте последовательного тестирования?
AЗаранее зафиксированный критерий, по которому останавливают тест и принимают решение по
H0 с учётом распределения уровня значимостиBПравило, по которому распределяют пользователей между контрольной и тестовой группой во время эксперимента в равных долях
CСпособ оценить ожидаемый прирост метрики без проведения теста, используя только результаты прошлых экспериментов и исторические данные
DРешение остановить тест в любой удобный момент без заранее зафиксированных критериев и без правил интерпретации результата
Правильный ответ. Правильное правило остановки заранее определяет условия завершения теста и сохраняет корректность вывода по
H0.Разбор
Если команда планирует промежуточные просмотры, нужно до запуска зафиксировать частоту промежуточного анализа и условия остановки. Это может быть остановка по границам для p-value или по порогу эффекта, но правила должны быть заранее. Так снижается риск подглядывания и переобучения на шуме, а распределение уровня значимости помогает контролировать ошибку I рода.
Проверь себя · 1/2разбор после ответа
В эксперименте вы делали ежедневные проверки. На 3-й день получили
p-value < alpha и остановили тест, но позже выяснилось, что при продолжении до 14 дней результат стал бы незначимым. Какое объяснение наиболее вероятно?Ещё вопросы по теме «Секвенциальное тестирование»
- Команда запускает A/B-тест и каждый день смотрит `p-value`; как только видит `p-value < alpha`, сразу завершает тест и объявляет победу. В чём главный риск такого подсматривания?
- Аналитик смотрит промежуточные результаты каждый день, но команда заранее зафиксировала длительность: тест идёт 14 дней, и решение принимают только по финальному анализу в конце. Что наиболее корректно про влияние такого подсматривания на ошибку первого рода для основной проверки?
- Что такое `alpha spending` в последовательном тестировании?
- Почему в корректном последовательном тестировании порог для ранней остановки обычно более строгий, чем в конце эксперимента?
- Заинтересованные стороны хотят еженедельные апдейты и возможность остановить тест раньше, если уже «всё ясно». Что лучше сделать до запуска?
- Все вопросы по «Секвенциальное тестирование» →