Аналитик оценивает удержание по списку email-подписчиков и делает выводы про всех пользователей продукта. В чём основная проблема?
AЭто
measurement error, потому что email всегда неверныйBЭто
survivorship bias, потому что подписчики всегда активнееCЭто ограничение покрытия:
sample формируется из неполного списка и даёт selection bias относительно populationDПроблемы нет, если подписчиков больше 10 тысяч
Правильный ответ. Если
sampling frame не покрывает всю population, возникают смещения из-за неполного покрытия.Разбор
Email-подписчики — это подмножество пользователей, и они могут отличаться по вовлечённости и мотивации. Поэтому метрики по ним могут систематически отличаться от метрик по всей population. Типичная ловушка — путать доступный список для отбора с реальной генеральной совокупностью.
Проверь себя · 1/3разбор после ответа
Вы хотите оценить средний чек за неделю для всех пользователей продукта. У вас есть данные по 5% пользователей, отобранных случайно. Что в этой задаче является
population?Ещё вопросы по теме «Выборка и смещение»
- Вы хотите оценить средний чек за неделю для всех пользователей продукта. У вас есть данные по 5% пользователей, отобранных случайно. Что в этой задаче является `population`?
- Вы измерили NPS только у iOS-пользователей через in-app опрос и хотите распространить результат на всех пользователей. Какой риск здесь ключевой?
- Вы выложили ссылку на опрос в соцсетях и получили ответы в основном от людей с сильным недовольством продуктом. Какое смещение наиболее вероятно?
- Аналитик посчитал средний доход на пользователя только среди тех, кто остался активным до 30-го дня, и сделал вывод о среднем доходе всех новичков. Какой bias здесь наиболее характерен?
- В опросе пользователи систематически занижают свой доход. Как лучше всего описать проблему в терминах качества данных?
- Все вопросы по «Выборка и смещение» →