Аналитик пробует 5 вариантов определения конверсии (разные окна) и выбирает тот, где p-value минимален. Как правильнее всего описать проблему?

AПроблемы нет: выбор определения по минимальному p-value делает вывод более точным
BЭто форма multiple comparisons и p-hacking: нужно фиксировать определение заранее или учитывать множественные проверки при интерпретации
CЭто автоматически означает, что FDR контролируется на уровне 0.05
DЭто допустимо только если затем применить Bonferroni к одному выбранному окну
Правильный ответ. Выбор определения после просмотра результатов фактически увеличивает число проверок, то есть создаёт multiple comparisons.

Разбор

Если вы попробовали несколько определений метрики и выбрали то, где результат лучше, вы повышаете шанс случайной находки. Даже если формально вы показываете один p-value, за ним стоит несколько попыток. Типичная защита — заранее фиксировать определение, либо явно маркировать анализ как исследовательский и подтверждать на новом запуске.

Проверь себя · 1/3разбор после ответа
Вы проверяете эффект фичи на 5 сегментах и 2 платформах и планируете в презентации выбрать самые 'успешные' результаты. Что разумнее всего считать семейством тестов для контроля FWER?
Тренировать статистику в Telegram

Ещё вопросы по теме «Множественные сравнения»