Какое поведение p-value вы ожидаете увидеть в корректном A/A‑тесте, если проводить много независимых прогонов?

Question

Карьерник · Accepted Answer

Правильный ответ: p-value распределён примерно равномерно, и около 5% прогонов случайно дадут p-value ниже 0.05. В корректном A/A‑тесте p-value распределён примерно равномерно, и около 5% прогонов случайно покажут p-value ниже 0.05. Если статистика и данные корректны, A/A‑тест имитирует ситуацию без эффекта. При уровне значимости 0.05 примерно 5% прогонов могут случайно показать «значимость» — это и есть ожидаемая частота ложных срабатываний. Если значимых результатов намного больше или они повторяются стабильно, это повод искать проблему в разбиении или сборе данных. Распределение p-value под нулевой гипотезой при правильно выбранном тесте близко к равномерному на отрезке от 0 до 1.

Какое поведение p-value вы ожидаете увидеть в корректном A/A‑тесте, если проводить много независимых прогонов?

Разбор

Ещё вопросы по теме «QA, SRM и раскатка»