Распределение трат на пользователя сильно скошено: много маленьких чеков и редкие большие. Почему для sample mean трат по 5000 пользователям часто работает normal approximation?

AПотому что по CLT sampling distribution sample mean становится близка к normal distribution при достаточно большой выборке
BПотому что LLN делает исходные траты normal distribution
CПотому что joint distribution трат и пользователей всегда имеет normal distribution
DПотому что normal approximation всегда точна независимо от размера выборки
Правильный ответ. CLT делает sampling distribution sample mean близкой к normal distribution при достаточно большой выборке.

Разбор

Исходные данные могут быть ненормальными, но sample mean строится через суммирование большого числа вкладов и деление на размер выборки. По CLT распределение этой статистики приближается к normal distribution, что и оправдывает normal approximation. При маленьких выборках и сильных выбросах приближение может быть заметно хуже.

Проверь себя · 1/3разбор после ответа
Если события A и B являются independent, какая формула верна?
Тренировать статистику в Telegram

Ещё вопросы по теме «Совместные распределения и ЦПТ»