У вас есть база email, которая покрывает только 70% пользователей. Как лучше всего назвать эту базу в контексте построения sample?

AЭто sampling frame (основа отбора), из которого берут sample, и его неполнота влияет на покрытие population
BЭто и есть вся population, потому что 70% достаточно
CЭто measurement error, потому что email не точный
DЭто survivorship bias, потому что email есть только у выживших
Правильный ответ. Список, из которого вы отбираете sample, может быть неполным относительно population и это важно явно фиксировать.

Разбор

Даже при случайном отборе внутри базы вы не получите репрезентативность для тех, кого в базе нет. Это ограничение покрытия, которое может приводить к смещённым выводам. Типичная ловушка — воспринимать доступный список как полную population и не замечать, кого он исключает.

Проверь себя · 1/3разбор после ответа
Вы хотите оценить средний чек за неделю для всех пользователей продукта. У вас есть данные по 5% пользователей, отобранных случайно. Что в этой задаче является population?
Тренировать статистику в Telegram

Ещё вопросы по теме «Выборка и смещение»