Вы считаете число кликов за день как sum по пользователям: каждый пользователь либо кликнул, либо нет. Почему распределение этой sum по дням часто хорошо описывается normal approximation при большом трафике?
AПотому что это
sum большого числа независимых вкладов, и по CLT она близка к normal distributionBПотому что
LLN делает каждый клик normal distributionCПотому что
joint distribution любых событий по определению имеет normal distributionDПотому что
normal approximation всегда точна для любых объёмов данныхПравильный ответ. Когда наблюдение — это
sum многих независимых вкладов, CLT объясняет появление normal approximation.Разбор
Каждый пользователь вносит маленький вклад 0 или 1, и таких вкладов много. Суммирование сглаживает индивидуальные различия и делает итоговую sum более предсказуемой. Поэтому в аналитике часто используют normal approximation для больших сумм и средних.
Проверь себя · 1/3разбор после ответа
Вы знаете
P(A) и P(B) для двух событий в продукте: просмотр карточки и покупка. Зачем может понадобиться joint distribution, если уже известны обе маргинальные вероятности?Ещё вопросы по теме «Совместные распределения и ЦПТ»
- В продуктовой аналитике вы смотрите одновременно `platform` (ios/android) и факт `purchase` (да/нет). Что описывает `joint distribution` (совместное распределение) этих двух признаков?
- Событие `A` — клик по рекламе, событие `B` — покупка. Какое утверждение лучше всего соответствует `independence` между `A` и `B`?
- Вы оцениваете средний чек как `sample mean` по 50 пользователям и затем по 5000 пользователям. Что утверждает `LLN` про поведение `sample mean` при росте размера выборки?
- Что является наиболее точным интуитивным описанием `CLT`?
- Распределение трат на пользователя сильно скошено: много маленьких чеков и редкие большие. Почему для `sample mean` трат по 5000 пользователям часто работает `normal approximation`?
- Все вопросы по «Совместные распределения и ЦПТ» →