Вы сравниваете две версии продукта, но группы сформированы не рандомно: версия A только в одном регионе, версия B только в другом. Команда хочет применить permutation test, переставляя метки. Что корректнее всего сказать?
A
Permutation test всегда корректен, потому что перестановки заменяют рандомизациюBНужно просто сделать больше перестановок, и проблема исчезнет
CДостаточно применить
bootstrap, и тогда причинный вывод станет корректнымDБез обменяемости меток перестановки не моделируют
H0; permutation test может быть некорректен, а bootstrap даст лишь интервал для разницы в этих данных, но не уберёт confoundingПравильный ответ. Без обменяемости меток перестановки не отражают
H0, поэтому permutation test может дать некорректный p-value.Разбор
В наблюдательном дизайне метка версии связана с регионом, а регион может влиять на метрику, поэтому простая перестановка меток нарушает структуру данных. Bootstrap в таком случае может оценить неопределённость наблюдаемой разницы, но не делает вывод причинным. Для причинного вывода нужен дизайн с рандомизацией или явный контроль факторов, иначе легко принять региональный эффект за эффект фичи.
Проверь себя · 1/3разбор после ответа
У каждого пользователя много событий, и события внутри пользователя коррелированы. Вы хотите оценить неопределённость метрики на уровне пользователя через
bootstrap. Что корректнее пересэмплировать?Ещё вопросы по теме «Бутстреп и перестановочные тесты»
- Что делает `bootstrap` на одном шаге, чтобы получить одну реплику статистики?
- Какая ключевая идея лежит в основе `permutation test` при проверке `H0` об отсутствии разницы между группами?
- Вы сделали 2000 повторов `bootstrap` для разницы средних A−B и получили 2000 значений разницы. Что из этого является `эмпирическое распределение` разницы средних?
- Как в `permutation test` обычно оценивают `p-value` для наблюдаемой статистики?
- Метрика имеет тяжёлые хвосты и сложную формулу (например, `revenue per user`). Какой подход часто удобен, чтобы оценить неопределённость оценки без сложных выводов формул?
- Все вопросы по «Бутстреп и перестановочные тесты» →