Представьте, что вы 100 раз независимо собираете выборку пользователей и каждый раз считаете sample mean выручки. Что говорит CLT про sampling distribution этого sample mean при большом размере выборки?
AПо
LLN все 100 значений будут одинаковымиBОна будет близка к
normal distribution, поэтому можно использовать normal approximation для confidence intervalCОна совпадёт с
joint distribution исходных трат пользователейDОна будет равномерной, потому что
sum имеет много возможных значенийПравильный ответ.
CLT описывает, что sampling distribution sample mean при большом размере выборки становится близка к normal distribution.Разбор
Важно, что CLT говорит о распределении оценок при повторении выборки, а не о распределении самих трат. Из этого следует практический инструмент: normal approximation для построения confidence interval вокруг sample mean. Поэтому CLT постоянно появляется в разговорах об оценках и неопределённости.
Проверь себя · 1/3разбор после ответа
Что становится примерно
normal distribution по смыслу CLT при большом размере выборки?Ещё вопросы по теме «Совместные распределения и ЦПТ»
- В продуктовой аналитике вы смотрите одновременно `platform` (ios/android) и факт `purchase` (да/нет). Что описывает `joint distribution` (совместное распределение) этих двух признаков?
- Событие `A` — клик по рекламе, событие `B` — покупка. Какое утверждение лучше всего соответствует `independence` между `A` и `B`?
- Вы оцениваете средний чек как `sample mean` по 50 пользователям и затем по 5000 пользователям. Что утверждает `LLN` про поведение `sample mean` при росте размера выборки?
- Что является наиболее точным интуитивным описанием `CLT`?
- Распределение трат на пользователя сильно скошено: много маленьких чеков и редкие большие. Почему для `sample mean` трат по 5000 пользователям часто работает `normal approximation`?
- Все вопросы по «Совместные распределения и ЦПТ» →