В тесте есть корректная randomization, но менеджер каждый день проверяет p-value и останавливает при p-value < alpha. Почему проблема всё равно остаётся?

ARandomization делает любые проверки безопасными, поэтому проблемы нет
BПроблема только в том, что размер control и treatment может быть не ровно 50/50
CПроблема в том, что lift нельзя считать на рандомизированных данных
DRandomization не исправляет нарушение stopping rule: peeking с optional stopping повышает Type I error и false positive
Правильный ответ. Randomization делает группы сопоставимыми, но не исправляет нарушение stopping rule: optional stopping повышает Type I error.

Разбор

Случайное распределение делает группы сопоставимыми и поддерживает causal inference. Но если правило остановки зависит от промежуточных результатов, стандартная проверка больше не гарантирует риск false positive на уровне alpha. Поэтому при частых проверках нужен либо fixed horizon, либо sequential testing с alpha spending.

Проверь себя · 1/3разбор после ответа
Почему в корректном sequential testing порог для ранней остановки обычно более строгий, чем в конце эксперимента?
Тренировать A/B в Telegram

Ещё вопросы по теме «Секвенциальное тестирование»