Вы считаете средний балл по NPS-вопросу как sample mean по 50 ответам и по 5000 ответам. Какое утверждение про стабильность оценки наиболее корректно?
AПри 5000 ответах
sample mean обычно менее шумная, потому что её sampling distribution становится ужеBРазмер выборки не влияет на шум
sample meanCПо
LLN sample mean становится ровно равной expected value и перестаёт менятьсяDПо
CLT исходные ответы становятся normal distributionПравильный ответ. При большем размере выборки
sampling distribution sample mean становится уже, и оценка стабильнее.Разбор
Маленькая выборка легко смещается несколькими случайными ответами, поэтому оценка скачет. При большом числе наблюдений вклад одного ответа мал, и колебания снижаются. Это полезно помнить, когда сравниваете метрики по маленьким сегментам.
Проверь себя · 1/3разбор после ответа
Вы считаете число кликов за день как
sum по пользователям: каждый пользователь либо кликнул, либо нет. Почему распределение этой sum по дням часто хорошо описывается normal approximation при большом трафике?Ещё вопросы по теме «Совместные распределения и ЦПТ»
- В продуктовой аналитике вы смотрите одновременно `platform` (ios/android) и факт `purchase` (да/нет). Что описывает `joint distribution` (совместное распределение) этих двух признаков?
- Событие `A` — клик по рекламе, событие `B` — покупка. Какое утверждение лучше всего соответствует `independence` между `A` и `B`?
- Вы оцениваете средний чек как `sample mean` по 50 пользователям и затем по 5000 пользователям. Что утверждает `LLN` про поведение `sample mean` при росте размера выборки?
- Что является наиболее точным интуитивным описанием `CLT`?
- Распределение трат на пользователя сильно скошено: много маленьких чеков и редкие большие. Почему для `sample mean` трат по 5000 пользователям часто работает `normal approximation`?
- Все вопросы по «Совместные распределения и ЦПТ» →