Вы выложили ссылку на опрос в соцсетях и получили ответы в основном от людей с сильным недовольством продуктом. Какое смещение наиболее вероятно?
AЭто
survivorship bias, потому что отвечают только те, кто осталсяBЭто
measurement error, потому что ответы субъективныCЭто
selection bias, потому что участие в опросе добровольное и зависит от мотивацииDЭто репрезентативная случайная выборка, потому что ответы реальные
Правильный ответ. При добровольных опросах часто возникает
selection bias из-за самоотбора.Разбор
Когда вероятность попасть в sample зависит от отношения к продукту, выборка становится смещённой. Недовольные пользователи чаще тратят время на ответ, и итоговые оценки могут систематически занижать удовлетворённость population. Типичная ошибка — интерпретировать такой опрос как «мнение всех пользователей» без поправок.
Проверь себя · 1/3разбор после ответа
Вы случайно отбираете для анализа не пользователей, а сессии (каждая сессия равновероятна попасть в
sample). Какой риск для оценки среднего числа сессий на пользователя?Ещё вопросы по теме «Выборка и смещение»
- Вы хотите оценить средний чек за неделю для всех пользователей продукта. У вас есть данные по 5% пользователей, отобранных случайно. Что в этой задаче является `population`?
- Вы измерили NPS только у iOS-пользователей через in-app опрос и хотите распространить результат на всех пользователей. Какой риск здесь ключевой?
- Аналитик посчитал средний доход на пользователя только среди тех, кто остался активным до 30-го дня, и сделал вывод о среднем доходе всех новичков. Какой bias здесь наиболее характерен?
- В опросе пользователи систематически занижают свой доход. Как лучше всего описать проблему в терминах качества данных?
- В email-опросе ответили 8% пользователей, и среди ответивших сильно больше VIP-клиентов, чем в `population`. Какой шаг наиболее уместен, чтобы снизить `selection bias` по известным признакам?
- Все вопросы по «Выборка и смещение» →