В тесте есть корректная рандомизация, но менеджер каждый день проверяет `p-value` и останавливает при `p-value

Question

В тесте есть корректная рандомизация, но менеджер каждый день проверяет `p-value` и останавливает при `p-value < alpha`. Почему проблема всё равно остаётся?

Карьерник · Accepted Answer

Правильный ответ: Рандомизация не исправляет нарушение правила остановки: подглядывание с правом досрочной остановки повышает вероятность ошибки I рода и долю ложноположительных результатов. Рандомизация делает группы сопоставимыми, но не исправляет нарушение правила остановки: досрочная остановка повышает ошибку I рода. Случайное распределение делает группы сопоставимыми и поддерживает причинный вывод. Но если правило остановки зависит от промежуточных результатов, стандартная проверка больше не гарантирует риск ложноположительного результата на уровне `alpha`. Поэтому при частых проверках нужен либо фиксированный горизонт наблюдения, либо последовательное тестирование с распределением `alpha`. Варианты про 50/50 и про невозможность считать `lift` ошибочны: рандомизация не запрещает оценивать эффект, она лишь не защищает от подглядывания.

В тесте есть корректная рандомизация, но менеджер каждый день проверяет `p-value` и останавливает при `p-value < alpha`. Почему проблема всё равно остаётся?

Разбор

Ещё вопросы по теме «Секвенциальное тестирование»

В тесте есть корректная рандомизация, но менеджер каждый день проверяет p-value и останавливает при p-value < alpha. Почему проблема всё равно остаётся?

Разбор

Ещё вопросы по теме «Секвенциальное тестирование»

В тесте есть корректная рандомизация, но менеджер каждый день проверяет `p-value` и останавливает при `p-value < alpha`. Почему проблема всё равно остаётся?