Вы оцениваете среднюю доходность фондов за 10 лет, используя только фонды, которые существуют сегодня, и игнорируете закрытые фонды. Какой bias наиболее вероятен и в какую сторону?
AЭто
measurement error, доходность обычно недооцениваетсяBЭто
survivorship bias, и доходность обычно завышаетсяCЭто
selection bias, и доходность обычно занижаетсяDЭто повышает
репрезентативность, потому что закрытые фонды нерелевантныПравильный ответ.
survivorship bias часто завышает результаты, потому что «плохие» объекты чаще исчезают из данных.Разбор
Если закрытые фонды закрывались из-за плохих результатов, их исключение делает оставшуюся выборку более успешной, чем была реальная population фондов. Это и есть survivorship bias. Типичная ловушка — принимать такие оценки как «истинные исторические результаты рынка» без учёта выбывших.
Проверь себя · 1/3разбор после ответа
Вы случайно отбираете для анализа не пользователей, а сессии (каждая сессия равновероятна попасть в
sample). Какой риск для оценки среднего числа сессий на пользователя?Ещё вопросы по теме «Выборка и смещение»
- Вы хотите оценить средний чек за неделю для всех пользователей продукта. У вас есть данные по 5% пользователей, отобранных случайно. Что в этой задаче является `population`?
- Вы измерили NPS только у iOS-пользователей через in-app опрос и хотите распространить результат на всех пользователей. Какой риск здесь ключевой?
- Вы выложили ссылку на опрос в соцсетях и получили ответы в основном от людей с сильным недовольством продуктом. Какое смещение наиболее вероятно?
- Аналитик посчитал средний доход на пользователя только среди тех, кто остался активным до 30-го дня, и сделал вывод о среднем доходе всех новичков. Какой bias здесь наиболее характерен?
- В опросе пользователи систематически занижают свой доход. Как лучше всего описать проблему в терминах качества данных?
- Все вопросы по «Выборка и смещение» →