Аналитик посчитал средний доход на пользователя только среди тех, кто остался активным до 30-го дня, и сделал вывод о среднем доходе всех новичков. Какой bias здесь наиболее характерен?

AЭто selection bias, потому что выбрали случайных пользователей
BЭто measurement error, потому что доход всегда измеряется с шумом
CЭто ошибка определения population, но смещения нет
DЭто survivorship bias, потому что из анализа исключены ушедшие пользователи
Правильный ответ. survivorship bias возникает, когда анализируют только «выживших» и игнорируют тех, кто выбыл.

Разбор

Пользователи, дожившие до 30-го дня, обычно отличаются от тех, кто ушёл раньше: они могут быть более вовлечёнными и платежеспособными. Поэтому средний доход по «выжившим» завышает оценку для всей population новичков. Типичная ловушка — строить метрики на условной подвыборке и выдавать их как общие.

Проверь себя · 1/3разбор после ответа
В population 80% пользователей — mobile и 20% — web, но в вашем sample получилось 95% mobile и 5% web из-за малого объёма. Какой подход помогает повысить репрезентативность по платформам?
Тренировать статистику в Telegram

Ещё вопросы по теме «Выборка и смещение»