В A/B тесте команда мониторит 12 метрик и сообщает только те, где `p-value`

Question

В A/B тесте команда мониторит 12 метрик и сообщает только те, где `p-value` < 0.05, без коррекции. Какой риск это создаёт?

Карьерник · Accepted Answer

Правильный ответ: Риск множественных сравнений: среди множества метрик легче случайно найти значимые, если не зафиксировать первичную метрику и не корректировать порог. Много метрик без коррекции увеличивает шанс случайно получить значимый результат и собрать ложноположительные находки из-за множественных сравнений. Если вы смотрите много метрик и выбираете только «красивые» результаты, вы по сути проводите множественные проверки. Даже без реального эффекта какая-то метрика может случайно стать значимой. Обычно это решают через заранее определённую первичную метрику и/или корректировки на множественность. Для вторичных метрик выводы часто формулируют осторожнее или подтверждают отдельно.

В A/B тесте команда мониторит 12 метрик и сообщает только те, где `p-value` < 0.05, без коррекции. Какой риск это создаёт?

Разбор

Ещё вопросы по теме «Множественное тестирование»

В A/B тесте команда мониторит 12 метрик и сообщает только те, где p-value < 0.05, без коррекции. Какой риск это создаёт?

Разбор

Ещё вопросы по теме «Множественное тестирование»

В A/B тесте команда мониторит 12 метрик и сообщает только те, где `p-value` < 0.05, без коррекции. Какой риск это создаёт?