В population 80% пользователей — mobile и 20% — web, но в вашем sample получилось 95% mobile и 5% web из-за малого объёма. Какой подход помогает повысить репрезентативность по платформам?
AСобирать данные только по mobile, потому что их больше
BИспользовать стратифицированный отбор или квоты, чтобы доли mobile/web в
sample соответствовали populationCИгнорировать платформы, потому что они не влияют на метрики
DЗаменить метрику на ту, где платформы не важны
Правильный ответ. Стратификация помогает приблизить структуру
sample к структуре population по важным признакам.Разбор
Когда sample случайно перекошен, оценки могут смещаться, если метрика различается между стратами. Стратифицированный отбор или квоты фиксируют доли, повышая репрезентативность и стабильность оценок. Типичная ошибка — сравнивать метрики между периодами, не контролируя, что изменился состав платформ.
Проверь себя · 1/3разбор после ответа
В опросе пользователи систематически занижают свой доход. Как лучше всего описать проблему в терминах качества данных?
Ещё вопросы по теме «Выборка и смещение»
- Вы хотите оценить средний чек за неделю для всех пользователей продукта. У вас есть данные по 5% пользователей, отобранных случайно. Что в этой задаче является `population`?
- Вы измерили NPS только у iOS-пользователей через in-app опрос и хотите распространить результат на всех пользователей. Какой риск здесь ключевой?
- Вы выложили ссылку на опрос в соцсетях и получили ответы в основном от людей с сильным недовольством продуктом. Какое смещение наиболее вероятно?
- Аналитик посчитал средний доход на пользователя только среди тех, кто остался активным до 30-го дня, и сделал вывод о среднем доходе всех новичков. Какой bias здесь наиболее характерен?
- В опросе пользователи систематически занижают свой доход. Как лучше всего описать проблему в терминах качества данных?
- Все вопросы по «Выборка и смещение» →