Вы считаете число кликов за день как sum по пользователям: каждый пользователь либо кликнул, либо нет. Почему распределение этой sum по дням часто хорошо описывается normal approximation при большом трафике?

AПотому что это sum большого числа независимых вкладов, и по CLT она близка к normal distribution
BПотому что LLN делает каждый клик normal distribution
CПотому что joint distribution любых событий по определению имеет normal distribution
DПотому что normal approximation всегда точна для любых объёмов данных
Правильный ответ. Когда наблюдение — это sum многих независимых вкладов, CLT объясняет появление normal approximation.

Разбор

Каждый пользователь вносит маленький вклад 0 или 1, и таких вкладов много. Суммирование сглаживает индивидуальные различия и делает итоговую sum более предсказуемой. Поэтому в аналитике часто используют normal approximation для больших сумм и средних.

Проверь себя · 1/3разбор после ответа
Вы знаете P(A) и P(B) для двух событий в продукте: просмотр карточки и покупка. Зачем может понадобиться joint distribution, если уже известны обе маргинальные вероятности?
Тренировать статистику в Telegram

Ещё вопросы по теме «Совместные распределения и ЦПТ»