Вы сделали пост-стратификационное взвешивание, чтобы sample совпал с population по полу и возрасту. Какое утверждение наиболее корректно?
AВзвешивание полностью убирает любой
selection biasBВзвешивание исправляет
measurement error в ответахCВзвешивание автоматически увеличивает размер
sampleDВзвешивание снижает смещение по известным признакам, но не исправляет смещения по неизвестным причинам самоотбора
Правильный ответ. Взвешивание помогает по тем признакам, которые вы контролируете, но не лечит весь
selection bias автоматически.Разбор
Если вы выровняли состав по полу и возрасту, оценки становятся ближе к population по этим осям. Но если вероятность ответа связана с удовлетворённостью или доходом, а вы это не измерили, смещение может остаться. Кроме того, веса могут увеличить дисперсию оценок, если некоторые группы недопредставлены. Типичная ошибка — считать веса «магическим» решением для любого bias.
Проверь себя · 1/3разбор после ответа
В email-опросе ответили 8% пользователей, и среди ответивших сильно больше VIP-клиентов, чем в
population. Какой шаг наиболее уместен, чтобы снизить selection bias по известным признакам?Ещё вопросы по теме «Выборка и смещение»
- Вы хотите оценить средний чек за неделю для всех пользователей продукта. У вас есть данные по 5% пользователей, отобранных случайно. Что в этой задаче является `population`?
- Вы измерили NPS только у iOS-пользователей через in-app опрос и хотите распространить результат на всех пользователей. Какой риск здесь ключевой?
- Вы выложили ссылку на опрос в соцсетях и получили ответы в основном от людей с сильным недовольством продуктом. Какое смещение наиболее вероятно?
- Аналитик посчитал средний доход на пользователя только среди тех, кто остался активным до 30-го дня, и сделал вывод о среднем доходе всех новичков. Какой bias здесь наиболее характерен?
- В опросе пользователи систематически занижают свой доход. Как лучше всего описать проблему в терминах качества данных?
- Все вопросы по «Выборка и смещение» →