Вы смотрите 20 метрик и для каждой делаете проверку на уровне `alpha` 0.05, а затем объявляете успехом любую метрику, где `p-value

Question

Вы смотрите 20 метрик и для каждой делаете проверку на уровне `alpha` 0.05, а затем объявляете успехом любую метрику, где `p-value < 0.05`. Какой риск возрастает сильнее всего?

Карьерник · Accepted Answer

Правильный ответ: Риск `Type II error` (пропустить эффект) становится нулевым.. Множественные проверки увеличивают общий риск `Type I error`, если не контролировать его на уровне набора гипотез. Даже если каждая проверка имеет `alpha` 0.05, при большом числе метрик растёт вероятность хотя бы одного ложноположительного результата. Это может привести к выводу об успехе на основе случайного шума. Практика — заранее фиксировать основные метрики и, при необходимости, применять подходы контроля множественных проверок.

Вы смотрите 20 метрик и для каждой делаете проверку на уровне `alpha` 0.05, а затем объявляете успехом любую метрику, где `p-value < 0.05`. Какой риск возрастает сильнее всего?

Разбор

Ещё вопросы по теме «Проверка гипотез и доверительные интервалы»

Вы смотрите 20 метрик и для каждой делаете проверку на уровне alpha 0.05, а затем объявляете успехом любую метрику, где p-value < 0.05. Какой риск возрастает сильнее всего?

Разбор

Ещё вопросы по теме «Проверка гипотез и доверительные интервалы»

Вы смотрите 20 метрик и для каждой делаете проверку на уровне `alpha` 0.05, а затем объявляете успехом любую метрику, где `p-value < 0.05`. Какой риск возрастает сильнее всего?