Если случайная ошибка измерения имеет нулевое среднее (например, E[error] = 0), то какое влияние она чаще всего оказывает на оценку среднего значения метрики?
AСоздаёт смещение отбора, потому что измерения становятся выборочными и зависят от значения наблюдаемой величины у конкретного пользователя.
BСистематически завышает оценку среднего значения метрики на величину дисперсии ошибки, особенно при росте размера выборки наблюдений.
CУвеличивает дисперсию оценки и снижает её точность, но не вносит направленного смещения в оценку среднего значения метрики.
DАвтоматически делает выборку репрезентативной по отношению к генеральной совокупности, поскольку ошибки ввода усредняются между наблюдениями.
Правильный ответ. Случайная ошибка измерения с нулевым средним обычно повышает шум оценки, но не создаёт систематического смещения среднего.
Разбор
Если ошибка измерения симметрична и в среднем равна нулю, то среднее значение не смещается, но становится менее точным из-за большей дисперсии. На практике это ухудшает доверительные интервалы и снижает чувствительность анализов. Типичная ошибка — путать случайный шум и систематическую ошибку, которая действительно смещает оценки. Смещение отбора и репрезентативность выборки — это другие явления, не связанные с симметричной случайной ошибкой.
Проверь себя · 1/3разбор после ответа
Вы оцениваете среднюю доходность фондов за 10 лет, используя только фонды, существующие сегодня, и игнорируете закрытые. Какая систематическая ошибка наиболее вероятна и в какую сторону сместит оценку?
Ещё вопросы по теме «Выборка и смещение»
- Вы хотите оценить средний чек за неделю для всех пользователей продукта. У вас есть данные по 5% пользователей, отобранных случайно. Что в этой задаче является генеральной совокупностью?
- Вы измерили NPS только у iOS-пользователей через опрос внутри приложения и хотите распространить результат на всех пользователей. Какой риск здесь ключевой?
- Вы выложили ссылку на опрос в соцсетях и получили ответы в основном от людей с сильным недовольством продуктом. Какое смещение наиболее вероятно?
- Аналитик посчитал средний доход на пользователя только среди тех, кто остался активным до 30-го дня, и сделал вывод о среднем доходе всех новичков. Какое смещение здесь наиболее характерно?
- В опросе пользователи систематически занижают свой доход. Как лучше всего описать проблему в терминах качества данных?
- Все вопросы по «Выборка и смещение» →