Question 1

Пусть `X1..Xn` — независимые наблюдения с `E[X]=μ`. Что верно про математическое ожидание выборочного среднего `x̄`?

Accepted Answer

Среднее выборки в типичных условиях является несмещённой оценкой среднего популяции: `E[x̄]=μ`. Оператор математического ожидания линеен, поэтому `E[x̄]` совпадает с `μ`, если наблюдения одинаково распределены и имеют ожидание `μ`. Это не означает, что `x̄` всегда равно `μ` на одной выборке: разброс описывается стандартной ошибкой и распределением выборочного среднего. Частая ошибка — смешивать утверждение про среднее по многим выборкам с утверждением про одну конкретную выборку. Варианты `μ/n` и `n*μ` относятся к другим объектам, а `σ^2/n` — это дисперсия выборочного среднего, а не его математическое ожидание.

Question 2

Вы посчитали `выборочное среднее` `x̄` по случайной выборке пользователей. Как корректно трактовать `x̄`?

Accepted Answer

Любая статистика, посчитанная по случайной выборке, сама является случайной величиной. Статистика `x̄` — функция от выборки, а выборка случайна, значит и результат случаен. Если мысленно повторять отбор выборок тем же способом, вы получите набор значений `x̄`, то есть его выборочное распределение. Частая ошибка — путать параметр популяции (например, `μ`) и оценку `x̄` по одной конкретной выборке. Распределение исходных значений в выборке — это другая сущность: оно описывает данные, а не поведение статистики при повторных отборах.

Question 3

Вы 1000 раз берёте случайные выборки размера n из одной популяции и каждый раз считаете `x̄`. Что из перечисленного является выборочным распределением для `x̄`?

Accepted Answer

Выборочное распределение — это распределение статистики (например, `x̄`) при многократно повторяемых выборках одного размера. Распределение данных описывает, как ведёт себя отдельное наблюдение, а выборочное распределение описывает, как «плавает» статистика по выборкам. Даже если данные сильно разбросаны, распределение `x̄` обычно уже за счёт усреднения. Типичная путаница — считать, что гистограмма исходных данных и есть распределение `x̄`, или путать его с временным рядом метрики.

Question 4

Что корректнее всего отличает стандартное отклонение данных от стандартной ошибки среднего `SE`?

Accepted Answer

Стандартное отклонение — про разброс данных, а `SE` — про разброс статистики `x̄`. Стандартное отклонение `σ` описывает разброс самих наблюдений вокруг их среднего значения. Стандартная ошибка среднего `SE` — это стандартное отклонение распределения выборочного среднего как случайной величины и считается как `SE = σ / √n`. То есть `SE` всегда меньше `σ` (а не больше), и при росте `n` уменьшается, тогда как `σ` остаётся характеристикой данных и от размера выборки не зависит. Утверждение, что это синонимы, неверно. Утверждение про обратную связь (SE про данные, SD про среднее) — путаница терминов.

Question 5

Вы увеличили размер выборки в эксперименте, а оценка среднего эффекта считается как `x̄`. Что происходит с разбросом `x̄` между повторениями эксперимента (то есть со стандартной ошибкой)?

Accepted Answer

Чем больше размер выборки, тем уже распределение среднего и тем меньше стандартная ошибка. Среднее «усредняет» случайные колебания, и при росте размера выборки оно становится более стабильным между повторениями. Это и есть интуиция: стандартная ошибка убывает как `1/√n`, точность растёт, но с убывающей отдачей. Частая ошибка — ожидать, что удвоение размера выборки удвоит точность, хотя на деле эффект слабее.

Вопросы по теме «Случайные величины и выборочные распределения»

Вопросы 1–5 из 20

Хотите тренировать интерактивно?

Другие темы: Статистика