Вы смотрите 20 метрик и для каждой делаете проверку на уровне alpha 0.05, а затем объявляете успехом любую метрику, где p-value < 0.05. Какой риск возрастает сильнее всего?
AРиск
Type II error (пропустить эффект) становится нулевым.BШирина каждого 95%
confidence interval автоматически станет меньше.CВероятность того, что
H0 истинна, увеличится.DРиск
Type I error на уровне набора метрик возрастает, и вы чаще получите ложноположительную находку.Правильный ответ. Множественные проверки увеличивают общий риск
Type I error, если не контролировать его на уровне набора гипотез.Разбор
Даже если каждая проверка имеет alpha 0.05, при большом числе метрик растёт вероятность хотя бы одного ложноположительного результата. Это может привести к выводу об успехе на основе случайного шума. Практика — заранее фиксировать основные метрики и, при необходимости, применять подходы контроля множественных проверок.
Проверь себя · 1/3разбор после ответа
Для uplift выручки на пользователя 95%
confidence interval получился очень широким: от -20% до +25%. Какое объяснение наиболее вероятно?Ещё вопросы по теме «Проверка гипотез и доверительные интервалы»
- В A/B тесте для конверсии вы получили `p-value` 0.03 при проверке `H0` об отсутствии разницы. Какая интерпретация корректна?
- Для разницы конверсий вы построили 95% `confidence interval`: от -0.2% до +1.4%. Что можно сказать о статистической значимости при `alpha` 0.05 и двусторонней проверке?
- Вы сравниваете долю конверсии (успех/неуспех) в A и B на больших выборках. Какой тест чаще всего выбирают как базовый для сравнения долей?
- Команда зафиксировала уровень значимости `alpha` 0.05. Что это в первую очередь контролирует в терминах ошибок?
- В A/B тесте при огромной выборке вы получили `p-value` < 0.001, но рост конверсии составил всего +0.02% при минимально полезном пороге +0.5%. Какое действие наиболее разумно?
- Все вопросы по «Проверка гипотез и доверительные интервалы» →