У вас метрика конверсии за день оценивается как доля покупок. Почему оценка на 10000 сессиях обычно менее шумная, чем на 100 сессиях?

AПотому что CLT заставляет конверсию стремиться к 50% независимо от продукта
BПотому что при большем размере выборки sample mean (доля) ближе к expected value и реже сильно отклоняется, что соответствует интуиции LLN
CПотому что joint distribution покупок и сессий становится фиксированной и перестаёт меняться
DПотому что normal approximation делает данные безошибочными
Правильный ответ. Чем больше наблюдений, тем стабильнее sample mean вокруг expected value, что соответствует LLN.

Разбор

На маленькой выборке случайность может сильно менять долю: одна дополнительная покупка заметно сдвигает результат. На большой выборке вклад одного события намного меньше, поэтому колебания снижаются. Это одна из причин, почему метрики на малом трафике трудно интерпретировать.

Проверь себя · 1/3разбор после ответа
Вы считаете число кликов за день как sum по пользователям: каждый пользователь либо кликнул, либо нет. Почему распределение этой sum по дням часто хорошо описывается normal approximation при большом трафике?
Тренировать статистику в Telegram

Ещё вопросы по теме «Совместные распределения и ЦПТ»