Вы считаете средний доход на пользователя как sample mean. Данные сильно скошены, но у вас большая выборка. Почему аналитики часто строят confidence interval для sample mean через normal approximation?
AПотому что
LLN делает confidence interval ненужнымBПотому что
joint distribution доходов всегда имеет normal distributionCПотому что по
CLT sampling distribution sample mean близка к normal distribution, что позволяет normal approximation для confidence intervalDПотому что исходные данные обязаны иметь
normal distribution, иначе интервалы запрещеныПравильный ответ.
CLT даёт основание использовать normal approximation для confidence interval вокруг sample mean при большом размере выборки.Разбор
Даже если исходный доход сильно скошен, среднее по большой выборке ведёт себя более регулярно. CLT описывает, что ошибка sample mean имеет примерно нормальную форму после стандартизации, а значит можно оценить неопределённость. Это работает лучше при больших объёмах и при отсутствии экстремальных выбросов, доминирующих в sum.
Проверь себя · 1/3разбор после ответа
Вы знаете
P(A) и P(B) для двух событий в продукте: просмотр карточки и покупка. Зачем может понадобиться joint distribution, если уже известны обе маргинальные вероятности?Ещё вопросы по теме «Совместные распределения и ЦПТ»
- В продуктовой аналитике вы смотрите одновременно `platform` (ios/android) и факт `purchase` (да/нет). Что описывает `joint distribution` (совместное распределение) этих двух признаков?
- Событие `A` — клик по рекламе, событие `B` — покупка. Какое утверждение лучше всего соответствует `independence` между `A` и `B`?
- Вы оцениваете средний чек как `sample mean` по 50 пользователям и затем по 5000 пользователям. Что утверждает `LLN` про поведение `sample mean` при росте размера выборки?
- Что является наиболее точным интуитивным описанием `CLT`?
- Распределение трат на пользователя сильно скошено: много маленьких чеков и редкие большие. Почему для `sample mean` трат по 5000 пользователям часто работает `normal approximation`?
- Все вопросы по «Совместные распределения и ЦПТ» →