Вы считаете средний доход на пользователя как `sample mean`. Данные сильно скошены, но у вас большая выборка. Почему аналитики часто строят `confidence interval` для `sample mean` через `normal approximation`?

Question

Карьерник · Accepted Answer

Правильный ответ: Потому что `LLN` делает `confidence interval` ненужным. `CLT` даёт основание использовать `normal approximation` для `confidence interval` вокруг `sample mean` при большом размере выборки. Даже если исходный доход сильно скошен, среднее по большой выборке ведёт себя более регулярно. `CLT` описывает, что ошибка `sample mean` имеет примерно нормальную форму после стандартизации, а значит можно оценить неопределённость. Это работает лучше при больших объёмах и при отсутствии экстремальных выбросов, доминирующих в `sum`.

Разбор

Ещё вопросы по теме «Совместные распределения и ЦПТ»