В генеральной совокупности 80% пользователей — mobile и 20% — web, но в вашей выборке получилось 95% mobile и 5% web из-за малого объёма. Какой подход помогает повысить репрезентативность по платформам?

Question

Карьерник · Accepted Answer

Правильный ответ: Использовать стратифицированный отбор или квоты: доли `mobile` и `web` в выборке приводятся к долям в генеральной совокупности. Стратификация помогает приблизить структуру выборки к структуре генеральной совокупности по важным признакам. Когда выборка перекошена по важной характеристике (платформа), оценки сводятся к группе с гипертрофированной долей. Стандартный приём — стратифицированный отбор или квоты при сборе, либо взвешивание `inverse probability` на этапе расчёта: вес каждого наблюдения обратно пропорционален вероятности его попадания в выборку, и средние возвращаются к долям популяции. Сужение до одной платформы и игнорирование платформ при разном поведении дают смещённые оценки. Поправка на доход или возраст без учёта платформы — поправка не на тот фактор.

Разбор

Ещё вопросы по теме «Выборка и смещение»