Вы построили 95% `confidence interval` для эффекта в 20 сегментах и выбрали один сегмент, где интервал не включает 0, чтобы рассказать о «победе». Что корректно сказать про такую интерпретацию?

Question

Карьерник · Accepted Answer

Правильный ответ: Так можно: `confidence interval` уже учитывает случайность, выбор сегмента ничего не меняет.. Выбор «лучшего» сегмента после просмотра многих нарушает частотный смысл `confidence interval` и снижает `покрытие`. Когда вы смотрите на много сегментов и выбираете один «самый красивый», вы фактически проводите множественный поиск и повышаете шанс случайной находки. Номинальный `confidence level` и заявленное `покрытие` относятся к заранее заданной процедуре, а не к выбранному постфактум результату. Обычно нужна повторная проверка на новых данных или корректировка подхода к множественным сравнениям.

Разбор

Ещё вопросы по теме «Доверительные интервалы»