Вы оцениваете средний чек как sample mean по 50 пользователям и затем по 5000 пользователям. Что утверждает LLN про поведение sample mean при росте размера выборки?
A
sample mean обязательно станет равной expected value уже при первом увеличении выборкиB
CLT гарантирует, что sample mean станет normal distribution, поэтому значение будет точнымC
sample mean будет всё чаще оказываться близко к expected value процесса при росте числа наблюденийD
joint distribution чеков и пользователей меняется, поэтому sample mean уходит от expected valueПравильный ответ. По
LLN sample mean сходится к expected value при увеличении размера выборки.Разбор
LLN не обещает, что sample mean будет монотонно приближаться или совпадёт ровно с expected value в конкретный день. Но вероятность больших отклонений уменьшается, и оценка становится стабильнее. Это объясняет, почему sample mean по большому числу пользователей обычно менее шумная.
Проверь себя · 1/3разбор после ответа
У вас есть только
P(A) и P(B) для двух событий. В каком случае вы можете найти P(A∩B) без полной joint distribution?Ещё вопросы по теме «Совместные распределения и ЦПТ»
- В продуктовой аналитике вы смотрите одновременно `platform` (ios/android) и факт `purchase` (да/нет). Что описывает `joint distribution` (совместное распределение) этих двух признаков?
- Событие `A` — клик по рекламе, событие `B` — покупка. Какое утверждение лучше всего соответствует `independence` между `A` и `B`?
- Что является наиболее точным интуитивным описанием `CLT`?
- Распределение трат на пользователя сильно скошено: много маленьких чеков и редкие большие. Почему для `sample mean` трат по 5000 пользователям часто работает `normal approximation`?
- У вас метрика конверсии за день оценивается как доля покупок. Почему оценка на 10000 сессиях обычно менее шумная, чем на 100 сессиях?
- Все вопросы по «Совместные распределения и ЦПТ» →