Вы посчитали sample mean по 20 пользователям, и построенная normal approximation выглядит подозрительно: оценка сильно меняется при добавлении пары пользователей. Что наиболее разумно сказать?
A
CLT не работает вообще, её можно игнорироватьBЭто значит, что
LLN нарушена, потому что LLN гарантирует normal approximationCРазмер выборки может быть слишком мал, поэтому
CLT даёт слабую normal approximation для sample meanDНужно перейти от
sample mean к joint distribution, и проблема исчезнетПравильный ответ. Для малого размера выборки
CLT может давать слабую normal approximation, особенно если данные скошены или есть выбросы.Разбор
CLT — это приближение, которое обычно становится лучше при росте размера выборки. Если несколько наблюдений резко меняют sample mean, значит шум ещё велик и итоговая оценка нестабильна. Практически это сигнал не делать слишком уверенных выводов и собирать больше данных.
Проверь себя · 1/3разбор после ответа
Какая запись соответствует вероятности того, что в одном наблюдении произойдут оба события
A и B?Ещё вопросы по теме «Совместные распределения и ЦПТ»
- В продуктовой аналитике вы смотрите одновременно `platform` (ios/android) и факт `purchase` (да/нет). Что описывает `joint distribution` (совместное распределение) этих двух признаков?
- Событие `A` — клик по рекламе, событие `B` — покупка. Какое утверждение лучше всего соответствует `independence` между `A` и `B`?
- Вы оцениваете средний чек как `sample mean` по 50 пользователям и затем по 5000 пользователям. Что утверждает `LLN` про поведение `sample mean` при росте размера выборки?
- Что является наиболее точным интуитивным описанием `CLT`?
- Распределение трат на пользователя сильно скошено: много маленьких чеков и редкие большие. Почему для `sample mean` трат по 5000 пользователям часто работает `normal approximation`?
- Все вопросы по «Совместные распределения и ЦПТ» →