В A/B тесте conversion to paid оценивается как доля успехов p_hat. При большом n что чаще всего верно про sampling distribution p_hat?

Ap_hat всегда имеет то же распределение, что и отдельные наблюдения 0/1
BПо CLT p_hat примерно нормально распределена, а SE ≈ √(p(1-p)/n)
Cp_hat становится равномерной на [0,1] при росте n
Dp_hat перестаёт быть случайная величина, потому что n большой
Правильный ответ. Для доли успехов p_hat при большом n обычно работает нормальная аппроксимация через CLT.

Разбор

Хотя отдельные наблюдения дискретны (0/1), среднее по ним (p_hat) при большом n ведёт себя почти как нормальная величина. Ширина sampling distribution задаётся SE ≈ √(p(1-p)/n), поэтому точность растёт как 1/√n. Частая ошибка — применять нормальную аппроксимацию при очень малых n или при экстремально малой/большой конверсии, когда аппроксимация может быть грубой.

Проверь себя · 1/3разбор после ответа
Если стандартная ошибка среднего подчиняется приближению SE ~ 1/√n, как изменится SE, если размер выборки увеличится с 400 до 1600 (при том же разбросе данных)?
Тренировать статистику в Telegram

Ещё вопросы по теме «Случайные величины и выборочные распределения»