В опросе пользователи систематически занижают свой доход. Как лучше всего описать проблему в терминах качества данных?

Question

Карьерник · Accepted Answer

Правильный ответ: Это систематическая ошибка измерения, которая смещает оценку среднего вниз даже на хорошей и большой репрезентативной выборке. Систематический `measurement error` приводит к смещению оценки, а не только к шуму. Если все пользователи в опросе систематически занижают доход (например, из-за желания казаться скромнее или страха налоговых вопросов), это measurement bias — систематическая ошибка измерения. Она смещает оценку даже на идеально репрезентативной выборке: выборочная статистика отклоняется от истинного значения в одну сторону. Survivorship bias предполагает разный отклик у бедных и богатых, что здесь не сказано. Ошибки измерения от разных пользователей не компенсируются, если они односторонние. И уж точно занижение дохода не устраняет smapling bias.

В опросе пользователи систематически занижают свой доход. Как лучше всего описать проблему в терминах качества данных?

Разбор

Ещё вопросы по теме «Выборка и смещение»