Вы проверили разницу конверсии в 20 сегментах и выбрали те, где `p-value

Question

Вы проверили разницу конверсии в 20 сегментах и выбрали те, где `p-value < 0.05`. В чём главный риск и что лучше сделать?

Карьерник · Accepted Answer

Правильный ответ: Главный риск, ложноположительные находки из-за множественных проверок: фиксируйте сегменты заранее или поправьте `alpha`. При множественных проверках растёт шанс случайных значимых `p-value`, поэтому нужны правила контроля ошибок. Если делать много проверок, даже при отсутствии эффекта где-то случайно появится значимость — это приводит к ложным выводам по сегментам и плохим продуктовым решениям. Практика — заранее зафиксировать список сегментов, заявить гипотезы и применять поправки на множественные сравнения или подтверждающий эксперимент. Ошибка — выдавать любой найденный сегмент как доказанный эффект.

Вы проверили разницу конверсии в 20 сегментах и выбрали те, где `p-value < 0.05`. В чём главный риск и что лучше сделать?

Разбор

Ещё вопросы по теме «Тесты для долей»

Вы проверили разницу конверсии в 20 сегментах и выбрали те, где p-value < 0.05. В чём главный риск и что лучше сделать?

Разбор

Ещё вопросы по теме «Тесты для долей»

Вы проверили разницу конверсии в 20 сегментах и выбрали те, где `p-value < 0.05`. В чём главный риск и что лучше сделать?