В email-опросе ответили 8% пользователей, и среди ответивших сильно больше VIP-клиентов, чем в population. Какой шаг наиболее уместен, чтобы снизить selection bias по известным признакам?

AПросто увеличить alpha и признать выводы значимыми
BСделать стратификацию/взвешивание ответов так, чтобы доли VIP и не-VIP в оценке соответствовали population
CУдалить все ответы VIP, чтобы не мешали
DСчитать результат валидным, потому что 8% — это много
Правильный ответ. Взвешивание и стратификация помогают приблизить sample к структуре population по известным признакам.

Разбор

Если вы знаете, что конкретный признак (например VIP) пере- или недопредставлен, можно использовать пост-стратификационные веса, чтобы восстановить доли как в population. Это снижает смещение по этому признаку, хотя не гарантирует устранение всех причин selection bias. Типичная ошибка — игнорировать перекос состава и интерпретировать ответы как репрезентативные.

Проверь себя · 1/3разбор после ответа
Если measurement error является случайным и имеет нулевое среднее (например, E[error]=0), то какое влияние он чаще всего оказывает на оценку среднего значения метрики?
Тренировать статистику в Telegram

Ещё вопросы по теме «Выборка и смещение»