Вы считаете число кликов за день как сумму по пользователям: каждый пользователь либо кликнул, либо нет. Почему распределение этой суммы по дням часто хорошо описывается нормальным приближением при большом трафике?
AЗакон больших чисел (
LLN) делает каждый отдельный клик нормально распределённым по своей природе вне суммыBЭто сумма большого числа независимых вкладов, и по
CLT она близка к нормальному распределению при росте nCПо
CLT выборочное среднее одного клика совпадает с распределением кликов и сохраняет его форму на больших выборкахDНормальное приближение для суммы биномиальных случайных величин работает при любом размере выборки и не требует условий
Правильный ответ. Когда наблюдение — это сумма многих независимых вкладов,
CLT объясняет появление нормального приближения.Разбор
Каждый пользователь вносит маленький вклад 0 или 1, и таких вкладов много. Суммирование сглаживает индивидуальные различия и делает итоговую сумму более предсказуемой. Поэтому в аналитике часто используют нормальное приближение для больших сумм и средних, опираясь на центральную предельную теорему.
Проверь себя · 1/3разбор после ответа
Вы оцениваете средний чек как выборочное среднее по 50 пользователям и затем по 5000 пользователям. Что утверждает
LLN про поведение выборочного среднего при росте размера выборки?Ещё вопросы по теме «Совместные распределения и ЦПТ»
- В продуктовой аналитике вы смотрите одновременно платформу (ios/android) и факт покупки (да/нет). Что описывает совместное распределение этих двух признаков?
- Событие A — клик по рекламе, событие B — покупка. Какое утверждение лучше всего соответствует независимости событий A и B?
- Вы оцениваете средний чек как выборочное среднее по 50 пользователям и затем по 5000 пользователям. Что утверждает `LLN` про поведение выборочного среднего при росте размера выборки?
- Что является наиболее точным интуитивным описанием центральной предельной теоремы (`CLT`)?
- Распределение трат на пользователя сильно скошено: много маленьких чеков и редкие большие. Почему для выборочного среднего трат по 5000 пользователям часто хорошо работает нормальное приближение?
- Все вопросы по «Совместные распределения и ЦПТ» →