Выборочное распределение среднего, стандартная ошибка, t-распределение — концепции, которые связывают теорию вероятностей с практическим статистическим выводом. На собеседовании спрашивают, чем стандартная ошибка отличается от стандартного отклонения и как размер выборки влияет на точность оценки.
Переход от 400 к 1600 — это увеличение `n` в 4 раза. По правилу `SE ~ 1/√n` это даёт уменьшение `SE` в `√4 = 2` раза. Это объясняет убывающую отдачу от роста выборки: чтобы ещё сильнее снизить `SE`, нужно непропорционально больше данных.
Чтобы говорить о `sampling distribution`, нужно представить, что вы снова и снова берёте выборку и каждый раз пересчитываете статистику. Тогда набор полученных значений и есть распределение этой статистики. Ошибка — воспринимать распределение исходных наблюдений как распределение `x̄` или другой выборочной статистики.
Для независимых наблюдений дисперсия суммы складывается, поэтому `Var(S)` растёт примерно линейно с `n`. Среднее делит сумму на `n`, поэтому его дисперсия уменьшается как `1/n`, что напрямую связано с уменьшением `SE` как `1/√n`. Это помогает интуитивно отличать поведение агрегатов: 'сумма' и 'среднее' ведут себя противоположно по точности. Ошибка — думать, что любое агрегирование автоматически делает показатель стабильнее.
Если метрика стала более шумной (больше `σ`), то и среднее будет менее стабильным между повторными выборками. При этом размер выборки не компенсирует рост шума сам по себе. Практический вывод: для более шумных метрик нужно больше `n`, чтобы добиться той же точности `x̄`. Ошибка — сравнивать точность экспериментов, глядя только на `n` и игнорируя разброс данных.
Сумма независимых наблюдений накапливает дисперсию, но деление на `n` при вычислении среднего 'усредняет' шум. Поэтому `Var(x̄)` меньше, чем `Var(X)`, и становится тем меньше, чем больше `n`. Типичная ошибка — думать, что среднее 'не меняет' разброс или уменьшает его как `1/√n` на уровне дисперсии, хотя `1/√n` относится к стандартному отклонению (`SE`).
В приложении — таймер, прогресс, стрики и 1700+ вопросов по всем темам.
Тренировать в Telegram