В эксперименте у вас 1 основная метрика и 3 `guardrail`-метрики, а также 10 сегментных разрезов. Какой подход к принятию решения наиболее корректен с точки зрения множественных проверок?

Question

Карьерник · Accepted Answer

Правильный ответ: Объявлять успех, если любая из метрик где-то значима при `p-value < 0.05`. Нужна заранее заданная `decision policy`: что первично, что ограничения, и как трактуются сегменты при `multiple comparisons`. Когда метрик и разрезов много, без явного правила легко случайно найти 'победу' и нарушить корректность вывода. Хорошая практика — заранее зафиксировать, по чему принимается решение, как обрабатываются `guardrail`, и является ли сегментный анализ подтверждающим или исследовательским. Если сегменты используются для отбора, это `multiple comparisons`, и нужно либо корректировать, либо подтверждать в отдельном запуске. Типичная ошибка — смешать все проверки в одно правило 'значимо где угодно'.

Разбор

Ещё вопросы по теме «Множественные сравнения»