Вы хотите оценить средний чек за неделю для всех пользователей продукта. У вас есть данные по 5% пользователей, отобранных случайно. Что в этой задаче является population?
AВсе пользователи продукта за неделю, для которых вы хотите сделать вывод
BТолько 5% пользователей, попавших в
sampleCТолько пользователи, которые совершили покупку
DТолько пользователи, которые заходили в приложение каждый день
Правильный ответ.
population — это вся совокупность, про которую вы делаете вывод, а sample — наблюдаемая часть.Разбор
Если цель — понять средний чек всех пользователей, то population — это именно все пользователи, а не только те, кто попал в выборку. sample — это 5% случайно выбранных пользователей, по которым вы оцениваете параметр population. Типичная ошибка — считать sample и population одним и тем же и забывать про ограничения покрытия.
Проверь себя · 1/3разбор после ответа
В
population 80% пользователей — mobile и 20% — web, но в вашем sample получилось 95% mobile и 5% web из-за малого объёма. Какой подход помогает повысить репрезентативность по платформам?Ещё вопросы по теме «Выборка и смещение»
- Вы измерили NPS только у iOS-пользователей через in-app опрос и хотите распространить результат на всех пользователей. Какой риск здесь ключевой?
- Вы выложили ссылку на опрос в соцсетях и получили ответы в основном от людей с сильным недовольством продуктом. Какое смещение наиболее вероятно?
- Аналитик посчитал средний доход на пользователя только среди тех, кто остался активным до 30-го дня, и сделал вывод о среднем доходе всех новичков. Какой bias здесь наиболее характерен?
- В опросе пользователи систематически занижают свой доход. Как лучше всего описать проблему в терминах качества данных?
- В email-опросе ответили 8% пользователей, и среди ответивших сильно больше VIP-клиентов, чем в `population`. Какой шаг наиболее уместен, чтобы снизить `selection bias` по известным признакам?
- Все вопросы по «Выборка и смещение» →