Вы проверили разницу конверсии в 20 сегментах и выбрали те, где p-value < 0.05. В чем главный риск и что лучше сделать?

AРиск ложноположительных находок из-за множественных проверок; лучше заранее фиксировать сегменты или контролировать ошибку, например корректировать alpha
BРиска нет, потому что p-value уже учитывает число сегментов
CНужно заменить z-test на correlation, тогда риска не будет
DНужно смотреть только сегмент с самой большой разницей, остальные игнорировать
Правильный ответ. При множественных проверках растет шанс случайных p-value < alpha, поэтому нужны правила контроля ошибок.

Разбор

Если вы делаете много тестов, даже при отсутствии эффекта где-то может 'случайно' появиться значимость. Это приводит к ложным выводам на уровне сегментов и плохим продуктовым решениям. Практика — заранее определить список сегментов, фиксировать гипотезы и применять корректировки или подтверждающий эксперимент. Ошибка — выдавать любой найденный сегмент как доказанный эффект.

Проверь себя · 1/3разбор после ответа
В A/B тесте конверсия выросла с 10% до 12%. Какая формулировка наиболее точная и минимизирует путаницу между процентами и процентными пунктами?
Тренировать статистику в Telegram

Ещё вопросы по теме «Тесты для долей»