В A/B тесте conversion to paid оценивается как доля успехов p_hat. При большом n что чаще всего верно про sampling distribution p_hat?
A
p_hat всегда имеет то же распределение, что и отдельные наблюдения 0/1BПо
CLT p_hat примерно нормально распределена, а SE ≈ √(p(1-p)/n)C
p_hat становится равномерной на [0,1] при росте nD
p_hat перестаёт быть случайная величина, потому что n большойПравильный ответ. Для доли успехов
p_hat при большом n обычно работает нормальная аппроксимация через CLT.Разбор
Хотя отдельные наблюдения дискретны (0/1), среднее по ним (p_hat) при большом n ведёт себя почти как нормальная величина. Ширина sampling distribution задаётся SE ≈ √(p(1-p)/n), поэтому точность растёт как 1/√n. Частая ошибка — применять нормальную аппроксимацию при очень малых n или при экстремально малой/большой конверсии, когда аппроксимация может быть грубой.
Проверь себя · 1/3разбор после ответа
Если стандартная ошибка среднего подчиняется приближению
SE ~ 1/√n, как изменится SE, если размер выборки увеличится с 400 до 1600 (при том же разбросе данных)?Ещё вопросы по теме «Случайные величины и выборочные распределения»
- Вы посчитали `выборочное среднее` `x̄` по случайной выборке пользователей. Как корректно трактовать `x̄`?
- Вы 1000 раз берёте случайные выборки размера n из одной популяции и каждый раз считаете `x̄`. Что из перечисленного является `sampling distribution` для `x̄`?
- Если стандартная ошибка среднего подчиняется приближению `SE ~ 1/√n`, как изменится `SE`, если размер выборки увеличится с 400 до 1600 (при том же разбросе данных)?
- Что утверждает `CLT` (интуитивно) про `выборочное среднее` `x̄` при достаточно большом `n`?
- Что корректнее всего отличает стандартное отклонение данных от стандартной ошибки среднего `SE`?
- Все вопросы по «Случайные величины и выборочные распределения» →