Что является наиболее точным интуитивным описанием CLT?
A
CLT говорит, что sample mean всегда равна expected valueB
CLT требует, чтобы исходные данные имели normal distributionC
CLT описывает joint distribution двух событийD
CLT говорит, что стандартизированная sum (или sample mean) имеет примерно normal distribution, что позволяет normal approximationПравильный ответ.
CLT объясняет, почему sampling distribution стандартизированной sum или sample mean часто близка к normal distribution.Разбор
Важно, что CLT говорит о распределении статистики при повторении выборок, а не о форме исходных данных. Поэтому CLT применяют к sample mean метрик по пользователям и к суммам событий. Это и есть причина популярности normal approximation в аналитике.
Проверь себя · 1/3разбор после ответа
Вы 100 раз подбрасываете монету и получаете долю орлов 0.62, а при 10000 подбрасываниях доля 0.51. Какая идея лучше всего объясняет, почему при увеличении числа бросков доля обычно становится ближе к истинной вероятности?
Ещё вопросы по теме «Совместные распределения и ЦПТ»
- В продуктовой аналитике вы смотрите одновременно `platform` (ios/android) и факт `purchase` (да/нет). Что описывает `joint distribution` (совместное распределение) этих двух признаков?
- Событие `A` — клик по рекламе, событие `B` — покупка. Какое утверждение лучше всего соответствует `independence` между `A` и `B`?
- Вы оцениваете средний чек как `sample mean` по 50 пользователям и затем по 5000 пользователям. Что утверждает `LLN` про поведение `sample mean` при росте размера выборки?
- Распределение трат на пользователя сильно скошено: много маленьких чеков и редкие большие. Почему для `sample mean` трат по 5000 пользователям часто работает `normal approximation`?
- У вас метрика конверсии за день оценивается как доля покупок. Почему оценка на 10000 сессиях обычно менее шумная, чем на 100 сессиях?
- Все вопросы по «Совместные распределения и ЦПТ» →