Вы считаете число кликов за день как `sum` по пользователям: каждый пользователь либо кликнул, либо нет. Почему распределение этой `sum` по дням часто хорошо описывается `normal approximation` при большом трафике?

Question

Карьерник · Accepted Answer

Правильный ответ: Потому что это `sum` большого числа независимых вкладов, и по `CLT` она близка к `normal distribution`. Когда наблюдение — это `sum` многих независимых вкладов, `CLT` объясняет появление `normal approximation`. Каждый пользователь вносит маленький вклад 0 или 1, и таких вкладов много. Суммирование сглаживает индивидуальные различия и делает итоговую `sum` более предсказуемой. Поэтому в аналитике часто используют `normal approximation` для больших сумм и средних.

Разбор

Ещё вопросы по теме «Совместные распределения и ЦПТ»