В опросе пользователи систематически занижают свой доход. Как лучше всего описать проблему в терминах качества данных?

AЭто систематический measurement error, который смещает оценку среднего вниз даже при хорошем sample
BЭто survivorship bias, потому что бедные отвечают чаще
CЭто повышает репрезентативность, потому что ошибки взаимно компенсируются
DЭто устраняет selection bias, потому что ответы становятся одинаковыми
Правильный ответ. Систематический measurement error приводит к смещению оценки, а не только к шуму.

Разбор

Если ошибки измерения имеют направление (например, занижение), то среднее по sample будет смещено относительно истинного среднего population. В отличие от случайного шума, такой measurement error не «усредняется» при большом объёме данных. Типичная ошибка — думать, что больше ответов автоматически исправит систематическую ошибку измерения.

Проверь себя · 1/3разбор после ответа
Вы оцениваете среднюю доходность фондов за 10 лет, используя только фонды, которые существуют сегодня, и игнорируете закрытые фонды. Какой bias наиболее вероятен и в какую сторону?
Тренировать статистику в Telegram

Ещё вопросы по теме «Выборка и смещение»