Question 1

Метрика времени ответа сильно скошена: много маленьких значений и редкие большие. Что чаще всего верно про распределение выборочного среднего `x̄` при росте `n`?

Accepted Answer

Центральная предельная теорема описывает нормализацию распределения среднего, а не изменение формы исходных данных. Даже если отдельные наблюдения сильно скошены, среднее по большому числу наблюдений становится более симметричным и приближается к нормальному распределению при росте `n`. Одновременно стандартная ошибка уменьшается, поэтому `x̄` становится более стабильной оценкой. Распространённая ошибка — думать, что центральная предельная теорема «лечит» выбросы в исходных данных или гарантирует нормальность уже при маленьком `n`.

Question 2

Две метрики имеют одинаковое истинное среднее, но первая намного более шумная (у данных больше дисперсия). При одинаковом размере выборки `n` у какой метрики выборочное распределение `x̄` будет шире?

Accepted Answer

Ширина выборочного распределения среднего определяется `SE`, а `SE` зависит от дисперсии данных и `n`. Стандартная ошибка выборочного среднего считается как `SE = σ / √n`, где `σ` — стандартное отклонение исходных данных. Чем шумнее метрика (больше `σ`), тем больше разброс `x̄` от выборки к выборке при фиксированном `n`, и тем шире доверительный интервал. Истинные средние одинаковы, но это центрирует распределения, а не определяет их ширину. Среднее значение метрики (центр распределения) на ширину `SE` напрямую не влияет — она зависит от стандартного отклонения, а не от математического ожидания.

Question 3

Что утверждает `CLT` (центральная предельная теорема, интуитивно) про выборочное среднее `x̄` при достаточно большом `n`?

Accepted Answer

По `CLT` нормальность относится к выборочному распределению среднего, а не к самим данным. Центральная предельная теорема говорит о выборочном распределении среднего, а не о форме самих данных. Если усреднять много независимых наблюдений с конечной дисперсией, распределение `x̄` стремится к нормальному при `n → ∞`. Исходные значения остаются такими, какими были — экспоненциальными, мультимодальными, тяжёлохвостыми. Никакого универсального порога вроде `n = 30` или `n = 5` не существует: для слабо асимметричных распределений уже 20-30 наблюдений работают хорошо, для сильно скошенных может потребоваться сотня и больше. Равномерным `x̄` не становится.

Question 4

Почему выборочная дисперсия на малой выборке (например, 20 наблюдений) может сильно отличаться при повторных случайных выборках из одной и той же популяции?

Accepted Answer

Выборочная дисперсия — это статистика, поэтому у неё есть разброс по выборкам, особенно при малом `n`. Выборочная дисперсия `s²` — это сама случайная величина: её значение зависит от того, какие именно наблюдения попали в выборку. На малых `n` распределение `s²` (в нормальной модели — масштабированное `χ²` с `n - 1` степенями свободы) широкое и асимметричное, поэтому повторные выборки дают сильно разные значения дисперсии. Это и есть причина больших колебаний. Дисперсия как параметр — характеристика популяции, но её оценка по выборке всегда случайна. Выборочная дисперсия не равна нулю на конечной выборке, и она не равна квадрату среднего.

Question 5

Команда повторяет одинаковый A/B-тест много раз и каждый раз считает эффект `Δ = x̄_B − x̄_A`. Значения `Δ` колеблются вокруг какого-то уровня. Как корректнее всего назвать распределение этих значений?

Accepted Answer

При повторении эксперимента статистика `Δ` сама образует распределение — выборочное распределение оценки. Даже при одинаковом истинном эффекте результаты разных запусков немного отличаются из-за случайного состава выборок. Это и есть выборочное распределение статистики `Δ`: как распределяются её оценки при повторении процедуры. Ошибка — интерпретировать одно значение `Δ` как точную величину эффекта без учёта разброса. Дисперсия по объединённым данным и распределение исходных наблюдений описывают совсем другие объекты.

Случайные величины и выборочные распределения: вопросы для собеседования (часть 3)

Вопросы 11–15 из 20

Хотите тренировать интерактивно?

Другие темы: Статистика