Команда запускает A/B-тест и каждый день смотрит `p-value`; как только видит `p-value

Question

Команда запускает A/B-тест и каждый день смотрит `p-value`; как только видит `p-value < alpha`, сразу завершает тест и объявляет победу. В чём главный риск такого подсматривания?

Карьерник · Accepted Answer

Правильный ответ: Растёт риск ошибки I рода (ложноположительного результата): правило остановки зависит от данных, и нет коррекции уровня значимости. Подсматривание с остановкой по `p-value` без коррекции повышает риск ложноположительного результата. Обычная интерпретация `p-value` при уровне `alpha` предполагает заранее зафиксированный план анализа. Если многократно проверять результат и останавливаться при первом `p-value < alpha`, фактически делается несколько попыток «поймать» значимость. Это увеличивает ошибку I рода, поэтому нужен фиксированный горизонт или последовательный тест с распределением `alpha`. Мощность сама по себе тут не падает, рандомизация остаётся валидной, а знак эффекта от подсматривания не переворачивается.

Команда запускает A/B-тест и каждый день смотрит `p-value`; как только видит `p-value < alpha`, сразу завершает тест и объявляет победу. В чём главный риск такого подсматривания?

Разбор

Ещё вопросы по теме «Секвенциальное тестирование»

Команда запускает A/B-тест и каждый день смотрит p-value; как только видит p-value < alpha, сразу завершает тест и объявляет победу. В чём главный риск такого подсматривания?

Разбор

Ещё вопросы по теме «Секвенциальное тестирование»

Команда запускает A/B-тест и каждый день смотрит `p-value`; как только видит `p-value < alpha`, сразу завершает тест и объявляет победу. В чём главный риск такого подсматривания?