Распределение трат на пользователя сильно скошено: много маленьких чеков и редкие большие. Почему для sample mean трат по 5000 пользователям часто работает normal approximation?
AПотому что по
CLT sampling distribution sample mean становится близка к normal distribution при достаточно большой выборкеBПотому что
LLN делает исходные траты normal distributionCПотому что
joint distribution трат и пользователей всегда имеет normal distributionDПотому что
normal approximation всегда точна независимо от размера выборкиПравильный ответ.
CLT делает sampling distribution sample mean близкой к normal distribution при достаточно большой выборке.Разбор
Исходные данные могут быть ненормальными, но sample mean строится через суммирование большого числа вкладов и деление на размер выборки. По CLT распределение этой статистики приближается к normal distribution, что и оправдывает normal approximation. При маленьких выборках и сильных выбросах приближение может быть заметно хуже.
Проверь себя · 1/3разбор после ответа
Если события
A и B являются independent, какая формула верна?Ещё вопросы по теме «Совместные распределения и ЦПТ»
- В продуктовой аналитике вы смотрите одновременно `platform` (ios/android) и факт `purchase` (да/нет). Что описывает `joint distribution` (совместное распределение) этих двух признаков?
- Событие `A` — клик по рекламе, событие `B` — покупка. Какое утверждение лучше всего соответствует `independence` между `A` и `B`?
- Вы оцениваете средний чек как `sample mean` по 50 пользователям и затем по 5000 пользователям. Что утверждает `LLN` про поведение `sample mean` при росте размера выборки?
- Что является наиболее точным интуитивным описанием `CLT`?
- У вас метрика конверсии за день оценивается как доля покупок. Почему оценка на 10000 сессиях обычно менее шумная, чем на 100 сессиях?
- Все вопросы по «Совместные распределения и ЦПТ» →