Вы хотите оценить churn подписчиков за месяц, но берёте в анализ только тех, кто открывал приложение на прошлой неделе. Что наиболее вероятно произойдёт с оценкой churn и почему?

AChurn будет завышен из-за measurement error
BChurn будет точным, потому что активные лучше отражают population
CChurn не изменится, потому что выборка случайная
DChurn будет занижен, потому что вы исключили «тихо ушедших» и получили selection bias с элементами survivorship bias
Правильный ответ. Если вы исключаете неактивных, вы меняете population анализа и обычно занижаете churn.

Разбор

Выборка только активных смещена в сторону пользователей, которые с большей вероятностью остаются, поэтому churn в такой sample будет ниже, чем в полной population подписчиков. Это смещение похоже на survivorship bias, потому что вы анализируете тех, кто «дожил» до условия активности. Типичная ошибка — не замечать, что фильтр по активности меняет сам объект оценки.

Проверь себя · 1/3разбор после ответа
Вы оцениваете среднюю доходность фондов за 10 лет, используя только фонды, которые существуют сегодня, и игнорируете закрытые фонды. Какой bias наиболее вероятен и в какую сторону?
Тренировать статистику в Telegram

Ещё вопросы по теме «Выборка и смещение»