В эксперименте вы заранее объявили 5 primary metrics и будете считать успехом, если хотя бы по одной p-value < alpha. Что происходит с общей вероятностью ложноположительного вывода и что обычно делают лучше?

AОбщая вероятность ложноположительного вывода становится меньше alpha, потому что метрик больше
BОбщая вероятность остается ровно alpha, если метрики независимы
CОбщая вероятность становится выше alpha, поэтому лучше выбрать одну primary metric или скорректировать alpha (например, Bonferroni/Holm).
DОбщая вероятность растет только если power меньше 50%
Правильный ответ. Если успех = «хотя бы одна p-value < alpha» по нескольким метрикам, то общий риск ложноположительного вывода (FWER) превышает alpha; лучше фиксировать одну primary metric или контролировать множественные проверки.

Разбор

Когда вы делаете несколько проверок и выбираете любую значимую, шанс случайно получить хотя бы один ложный сигнал растет. Поэтому общий уровень ошибки уже не равен исходному alpha. На практике заранее фиксируют одну primary metric или применяют контроль множественных проверок, например Bonferroni, чтобы ограничить общий риск ложноположительных выводов.

Проверь себя · 1/3разбор после ответа
Вы держите MDE и power фиксированными, но хотите снизить alpha с 5% до 1%. Что в среднем произойдет с требуемым sample size?
Тренировать A/B в Telegram

Ещё вопросы по теме «Размер выборки и мощность теста»