У вас есть только одна историческая выборка, но нужно прикинуть sampling distribution для x̄ без повторного сбора данных. Какой подход наиболее уместен?
AПоменять местами значения в выборке один раз и считать, что это новое распределение
BПросто взять
SE равной нулю, потому что данные уже собраныCИспользовать
CLT и всегда считать распределение x̄ строго нормальным, независимо от nDСделать
bootstrap: многократно ресемплировать наблюдения с возвращением и пересчитывать x̄Правильный ответ.
Bootstrap эмпирически аппроксимирует sampling distribution, имитируя повторные выборки из имеющихся данных.Разбор
Когда вы не можете реально повторить сбор данных, bootstrap даёт практический способ оценить разброс статистики. Вы много раз строите псевдовыборки и смотрите, как меняется x̄, получая приближение sampling distribution. Это особенно полезно при сложных статистиках или когда предпосылки нормальности сомнительны. Частая ошибка — использовать bootstrap и забывать, что он наследует смещения и структуру данных исходной выборки.
Проверь себя · 1/3разбор после ответа
Есть n независимых наблюдений с дисперсией
σ^2. Как корректно описать, как меняются дисперсии статистик S=ΣXi и x̄ при росте n?Ещё вопросы по теме «Случайные величины и выборочные распределения»
- Вы посчитали `выборочное среднее` `x̄` по случайной выборке пользователей. Как корректно трактовать `x̄`?
- Вы 1000 раз берёте случайные выборки размера n из одной популяции и каждый раз считаете `x̄`. Что из перечисленного является `sampling distribution` для `x̄`?
- Если стандартная ошибка среднего подчиняется приближению `SE ~ 1/√n`, как изменится `SE`, если размер выборки увеличится с 400 до 1600 (при том же разбросе данных)?
- Что утверждает `CLT` (интуитивно) про `выборочное среднее` `x̄` при достаточно большом `n`?
- Что корректнее всего отличает стандартное отклонение данных от стандартной ошибки среднего `SE`?
- Все вопросы по «Случайные величины и выборочные распределения» →