Аналитик оценивает удержание по списку email-подписчиков и делает выводы про всех пользователей продукта. В чём основная проблема?

AЭто measurement error, потому что email всегда неверный
BЭто survivorship bias, потому что подписчики всегда активнее
CЭто ограничение покрытия: sample формируется из неполного списка и даёт selection bias относительно population
DПроблемы нет, если подписчиков больше 10 тысяч
Правильный ответ. Если sampling frame не покрывает всю population, возникают смещения из-за неполного покрытия.

Разбор

Email-подписчики — это подмножество пользователей, и они могут отличаться по вовлечённости и мотивации. Поэтому метрики по ним могут систематически отличаться от метрик по всей population. Типичная ловушка — путать доступный список для отбора с реальной генеральной совокупностью.

Проверь себя · 1/3разбор после ответа
Вы хотите оценить средний чек за неделю для всех пользователей продукта. У вас есть данные по 5% пользователей, отобранных случайно. Что в этой задаче является population?
Тренировать статистику в Telegram

Ещё вопросы по теме «Выборка и смещение»