В A/B тесте при огромной выборке вы получили p-value < 0.001, но рост конверсии составил всего +0.02% при минимально полезном пороге +0.5%. Какое действие наиболее разумно?

AСчитать результат статистически значимым, но оценить практическую полезность и бизнес-эффект, потому что эффект может быть слишком мал.
BСразу выкатывать изменение, потому что маленький p-value гарантирует большой эффект.
CИгнорировать результат, потому что при p-value < 0.001 тест точно сломан.
DСделать вывод, что H0 верна, потому что эффект слишком мал.
Правильный ответ. Статистическая значимость по p-value не равна практической полезности эффекта.

Разбор

При больших выборках даже очень маленькие эффекты могут стать статистически значимыми. Поэтому важно смотреть на размер эффекта и сравнивать его с бизнес-порогом, а также на confidence interval, чтобы понимать диапазон возможных значений. Решение о выкатывании должно учитывать стоимость внедрения и ожидаемую выгоду.

Проверь себя · 1/3разбор после ответа
Для uplift выручки 95% confidence interval равен от +0.1% до +0.3% (0 не входит), но бизнес считает полезным только эффект от +2% и выше. Какой вывод наиболее корректен?
Тренировать A/B в Telegram

Ещё вопросы по теме «Проверка гипотез и доверительные интервалы»