Вы посчитали выборочное среднее по 20 пользователям, и нормальное приближение выглядит подозрительно: оценка сильно меняется при добавлении пары пользователей. Что наиболее разумно сказать?
A
CLT начинает работать только при выборках больше 10000 наблюдений и принципиально неприменим к малым размерамBЗакон больших чисел (
LLN) обычно нарушается на 20 наблюдениях, и нормальное приближение страдает именно из-за нарушения LLNCРазмер выборки слишком мал, поэтому
CLT даёт слабое нормальное приближение для выборочного среднегоDНужно использовать медиану вместо среднего, тогда нормальное приближение автоматически становится точным на любых данных
Правильный ответ. Для малого размера выборки
CLT может давать слабое нормальное приближение, особенно если данные скошены или есть выбросы.Разбор
CLT — это приближение, которое обычно становится лучше при росте размера выборки. Если несколько наблюдений резко меняют выборочное среднее, значит шум ещё велик и итоговая оценка нестабильна. Практически это сигнал не делать слишком уверенных выводов и собирать больше данных. LLN отвечает за сходимость среднего к ожиданию, а не за нормальность, а переход к совместному распределению вообще не относится к проблеме малого размера выборки.
Проверь себя · 1/3разбор после ответа
Что становится примерно нормально распределённым по смыслу
CLT при большом размере выборки?Ещё вопросы по теме «Совместные распределения и ЦПТ»
- В продуктовой аналитике вы смотрите одновременно платформу (ios/android) и факт покупки (да/нет). Что описывает совместное распределение этих двух признаков?
- Событие A — клик по рекламе, событие B — покупка. Какое утверждение лучше всего соответствует независимости событий A и B?
- Вы оцениваете средний чек как выборочное среднее по 50 пользователям и затем по 5000 пользователям. Что утверждает `LLN` про поведение выборочного среднего при росте размера выборки?
- Что является наиболее точным интуитивным описанием центральной предельной теоремы (`CLT`)?
- Распределение трат на пользователя сильно скошено: много маленьких чеков и редкие большие. Почему для выборочного среднего трат по 5000 пользователям часто хорошо работает нормальное приближение?
- Все вопросы по «Совместные распределения и ЦПТ» →