Вы запускаете `A/B/n`-эксперимент: контроль и 3 варианта интерфейса. Что принципиально меняется по сравнению с `A/B` в части риска ложноположительных результатов, если проверять каждое сравнение на `alpha` 0.05 без коррекции?

Question

Карьерник · Accepted Answer

Правильный ответ: Возникает проблема множественных сравнений: общий шанс получить хотя бы один ложноположительный результат растёт, поэтому нужен план сравнений и коррекция. В `A/B/n` число проверок обычно больше, поэтому без коррекции растёт вероятность ложноположительных результатов из-за множественных сравнений. В `A/B` часто проверяют одну основную гипотезу, а в `A/B/n` появляется несколько сравнений, например каждый вариант против контроля. Если каждое сравнение делать на одном и том же `alpha`, общий шанс случайно увидеть значимость хотя бы где-то становится выше. Поэтому важно заранее определить, какие сравнения входят в одну семью, и применять подходящую коррекцию.

Разбор

Ещё вопросы по теме «Множественное тестирование»