Какая ключевая идея лежит в основе перестановочного теста при проверке нулевой гипотезы об отсутствии разницы между группами?

AМногократно брать выборки из исходных данных с возвращением и строить интервал по разбросу полученных значений
BУдалять подозрительные выбросы из выборки и повторять тест на оставшихся данных до получения статистической значимости
CПереставлять метки групп между наблюдениями и смотреть, насколько часто статистика столь же экстремальна, как наблюдаемая
DСразу применять нормальное приближение к любой метрике независимо от размера выборки и формы распределения
Правильный ответ. Перестановочный тест строит распределение статистики при нулевой гипотезе, переставляя метки групп между наблюдениями.

Разбор

Если нулевая гипотеза верна, то метки групп не должны влиять на значения метрики, и наблюдения становятся обменяемыми. Мы многократно переставляем метки, пересчитываем статистику и получаем распределение при нулевой гипотезе. Затем оцениваем p-value как долю перестановок, где статистика не менее экстремальна, чем наблюдаемая. Это непараметрический подход, не требующий нормального приближения.

Проверь себя · 1/3разбор после ответа
Метрика ARPU = sum(revenue)/count(users), у пользователя может быть несколько покупок. Вы хотите оценить разницу ARPU между A и B через bootstrap. Какой ресэмплинг наиболее корректен?
Тренировать статистику в Telegram

Ещё вопросы по теме «Бутстреп и перестановочные тесты»