Случайные величины и выборочные распределения: вопросы для собеседования (часть 2)

Выборочное распределение среднего, стандартная ошибка, t-распределение — концепции, которые связывают теорию вероятностей с практическим статистическим выводом. На собеседовании спрашивают, чем стандартная ошибка отличается от стандартного отклонения и как размер выборки влияет на точность оценки.

Хи-квадрат и таблицы сопряжённостиДоверительные интервалыКорреляция и регрессияОписательная статистикаОсновы проверки гипотезМножественные сравненияТочечные оценки и MLEБутстреп и перестановочные тестыВыборка и смещениеТесты для среднихТесты для долей

Вопросы 610 из 20

6Если стандартная ошибка среднего подчиняется приближению `SE ~ 1/√n`, как изменится `SE`, если размер выборки увеличится с 400 до 1600 (при том же разбросе данных)?
AНе изменится
BУменьшится в 4 раза
CУменьшится в 2 раза
DУвеличится в 2 раза
Ответ: При фиксированном разбросе данных `SE` уменьшается примерно как `1/√n`.

Переход от 400 к 1600 — это увеличение `n` в 4 раза. По правилу `SE ~ 1/√n` это даёт уменьшение `SE` в `√4 = 2` раза. Это объясняет убывающую отдачу от роста выборки: чтобы ещё сильнее снизить `SE`, нужно непропорционально больше данных.

7Что такое `sampling distribution` статистики (например, `x̄`)?
AРаспределение значений статистики при мысленном повторении отбора выборок одним и тем же способом
BРаспределение истинного параметра `μ` в популяции
CРаспределение погрешности измерительного прибора
DЛюбая гистограмма, построенная по данным один раз
Ответ: `Sampling distribution` — это распределение статистики, если эксперимент повторять много раз.

Чтобы говорить о `sampling distribution`, нужно представить, что вы снова и снова берёте выборку и каждый раз пересчитываете статистику. Тогда набор полученных значений и есть распределение этой статистики. Ошибка — воспринимать распределение исходных наблюдений как распределение `x̄` или другой выборочной статистики.

8Есть n независимых наблюдений с дисперсией `σ^2`. Как корректно описать, как меняются дисперсии статистик `S=ΣXi` и `x̄` при росте `n`?
AИ `Var(S)`, и `Var(x̄)` уменьшаются как `1/n`
BИ `Var(S)`, и `Var(x̄)` растут как `n`
C`Var(S)` растёт примерно как `nσ^2`, а `Var(x̄)` падает как `σ^2/n`
DИ `Var(S)`, и `Var(x̄)` не зависят от `n`
Ответ: Сумма накапливает разброс, а среднее его усредняет: `Var(S)` растёт, `Var(x̄)` падает.

Для независимых наблюдений дисперсия суммы складывается, поэтому `Var(S)` растёт примерно линейно с `n`. Среднее делит сумму на `n`, поэтому его дисперсия уменьшается как `1/n`, что напрямую связано с уменьшением `SE` как `1/√n`. Это помогает интуитивно отличать поведение агрегатов: 'сумма' и 'среднее' ведут себя противоположно по точности. Ошибка — думать, что любое агрегирование автоматически делает показатель стабильнее.

9При фиксированном размере выборки `n` стандартная ошибка среднего связана с разбросом данных как `SE = σ/√n`. Если стандартное отклонение метрики `σ` выросло в 2 раза, что произойдёт с `SE`?
AУменьшится в 2 раза
BУвеличится в 2 раза
CНе изменится
DУвеличится в 4 раза
Ответ: По формуле `SE = σ/√n` при фиксированном `n` `SE` растёт пропорционально `σ`.

Если метрика стала более шумной (больше `σ`), то и среднее будет менее стабильным между повторными выборками. При этом размер выборки не компенсирует рост шума сам по себе. Практический вывод: для более шумных метрик нужно больше `n`, чтобы добиться той же точности `x̄`. Ошибка — сравнивать точность экспериментов, глядя только на `n` и игнорируя разброс данных.

10Пусть `X` — `случайная величина` с дисперсией `σ^2`, а `x̄` — среднее n независимых наблюдений `X1..Xn`. Чему равна `Var(x̄)`?
A`Var(x̄) = σ^2 * n`
B`Var(x̄) = σ^2`
C`Var(x̄) = σ^2 / √n`
D`Var(x̄) = σ^2 / n`
Ответ: У среднего дисперсия уменьшается как `1/n`, то есть `Var(x̄)=σ^2/n` при независимости.

Сумма независимых наблюдений накапливает дисперсию, но деление на `n` при вычислении среднего 'усредняет' шум. Поэтому `Var(x̄)` меньше, чем `Var(X)`, и становится тем меньше, чем больше `n`. Типичная ошибка — думать, что среднее 'не меняет' разброс или уменьшает его как `1/√n` на уровне дисперсии, хотя `1/√n` относится к стандартному отклонению (`SE`).

1234

Хотите тренировать интерактивно?

В приложении — таймер, прогресс, стрики и 1700+ вопросов по всем темам.

Тренировать в Telegram

Другие темы: Статистика

Хи-квадрат и таблицы сопряжённостиДоверительные интервалыКорреляция и регрессияОписательная статистикаОсновы проверки гипотезМножественные сравненияТочечные оценки и MLEБутстреп и перестановочные тестыВыборка и смещениеТесты для среднихТесты для долей