Если ложноположительное решение (Type I error) очень дорого для бизнеса, какое изменение настройки тестирования чаще всего уместно?
AСнизить
alpha, чтобы уменьшить риск Type I error, понимая, что может потребоваться больше данных для той же мощности.BПовысить
alpha, чтобы быстрее находить значимые результаты.CИгнорировать
alpha и смотреть только на знак эффекта.DСчитать значимым любой результат, где
p-value больше 0.5.Правильный ответ. Меньший
alpha снижает риск Type I error, но обычно увеличивает требования к размеру выборки для обнаружения эффекта.Разбор
Когда цена ложного запуска высока, разумно сделать критерий строгим и уменьшить вероятность ложноположительных выводов. Это часто означает снижение alpha и более осторожные решения. Компромисс в том, что растёт риск Type II error при фиксированной выборке, поэтому может потребоваться увеличить длительность эксперимента или размер выборки.
Проверь себя · 1/3разбор после ответа
Для uplift выручки 95%
confidence interval равен от +0.1% до +0.3% (0 не входит), но бизнес считает полезным только эффект от +2% и выше. Какой вывод наиболее корректен?Ещё вопросы по теме «Проверка гипотез и доверительные интервалы»
- В A/B тесте для конверсии вы получили `p-value` 0.03 при проверке `H0` об отсутствии разницы. Какая интерпретация корректна?
- Для разницы конверсий вы построили 95% `confidence interval`: от -0.2% до +1.4%. Что можно сказать о статистической значимости при `alpha` 0.05 и двусторонней проверке?
- Вы сравниваете долю конверсии (успех/неуспех) в A и B на больших выборках. Какой тест чаще всего выбирают как базовый для сравнения долей?
- Команда зафиксировала уровень значимости `alpha` 0.05. Что это в первую очередь контролирует в терминах ошибок?
- В A/B тесте при огромной выборке вы получили `p-value` < 0.001, но рост конверсии составил всего +0.02% при минимально полезном пороге +0.5%. Какое действие наиболее разумно?
- Все вопросы по «Проверка гипотез и доверительные интервалы» →