В A/B-тесте группы сформированы случайно, а распределение метрики далеко от нормального. Вам нужен p-value для H0: разницы нет. Что наиболее естественно использовать?

AСчитать p-value как 1 минус среднее значение метрики
BСтроить только bootstrap интервал и называть его p-value без оговорок
CИспользовать визуальную проверку и не считать p-value
DСделать permutation test, переставляя метки групп и сравнивая статистику с наблюдаемой
Правильный ответ. При рандомизации permutation test даёт прямой способ получить p-value без предположения нормальности.

Разбор

Перестановочный тест строит распределение статистики при H0 через перестановки меток, что хорошо сочетается с логикой рандомизации. Это особенно полезно для метрик с тяжёлыми хвостами или нестандартных статистик. Типичная ошибка — применять permutation test к данным, где группы не обменяемы (например, разные источники трафика), и получать некорректный p-value.

Проверь себя · 1/3разбор после ответа
У каждого пользователя много событий, и события внутри пользователя коррелированы. Вы хотите оценить неопределённость метрики на уровне пользователя через bootstrap. Что корректнее пересэмплировать?
Тренировать статистику в Telegram

Ещё вопросы по теме «Бутстреп и перестановочные тесты»