Вы считаете средний доход на пользователя как sample mean. Данные сильно скошены, но у вас большая выборка. Почему аналитики часто строят confidence interval для sample mean через normal approximation?

AПотому что LLN делает confidence interval ненужным
BПотому что joint distribution доходов всегда имеет normal distribution
CПотому что по CLT sampling distribution sample mean близка к normal distribution, что позволяет normal approximation для confidence interval
DПотому что исходные данные обязаны иметь normal distribution, иначе интервалы запрещены
Правильный ответ. CLT даёт основание использовать normal approximation для confidence interval вокруг sample mean при большом размере выборки.

Разбор

Даже если исходный доход сильно скошен, среднее по большой выборке ведёт себя более регулярно. CLT описывает, что ошибка sample mean имеет примерно нормальную форму после стандартизации, а значит можно оценить неопределённость. Это работает лучше при больших объёмах и при отсутствии экстремальных выбросов, доминирующих в sum.

Проверь себя · 1/3разбор после ответа
Вы знаете P(A) и P(B) для двух событий в продукте: просмотр карточки и покупка. Зачем может понадобиться joint distribution, если уже известны обе маргинальные вероятности?
Тренировать статистику в Telegram

Ещё вопросы по теме «Совместные распределения и ЦПТ»