Для uplift выручки 95% доверительный интервал равен от +0.1% до +0.3% (0 не входит), но бизнес считает полезным только эффект от +2% и выше. Какой вывод наиболее корректен?

AЭффект статистически значим, но интервал лежит ниже бизнес-порога полезности: практическая ценность под вопросом
BЭффект большой и точно окупится: доверительный интервал не включает 0 и значимость подтверждена тестом
CЭффект статистически незначим: диапазон значений лежит ниже бизнес-порога 2% и около нуля по выручке
DНикаких выводов сделать нельзя: интервал слишком узкий и наблюдений в эксперименте, скорее всего, мало
Правильный ответ. Даже при статистической значимости важно сравнивать эффект и доверительный интервал с практическим порогом полезности.

Разбор

Интервал полностью выше 0, значит при уровне значимости 0,05 двусторонняя проверка обычно значима. Но если весь диапазон эффекта лежит ниже бизнес-порога, то практическая ценность сомнительна. Такие случаи часто возникают на больших выборках: статистика уверенно фиксирует малый эффект, который не помогает продукту.

Проверь себя · 1/3разбор после ответа
Вы сравниваете средний чек в группах A и B (не долю), а дисперсии заранее неизвестны. Какой базовый тест чаще всего используют для сравнения средних?
Тренировать A/B в Telegram

Ещё вопросы по теме «Проверка гипотез и доверительные интервалы»