Какой набор данных лучше всего помогает уменьшить survivorship bias при анализе исторических результатов объектов (например компаний, фондов или клиентов)?

AТолько текущие активные объекты, потому что они релевантнее
BТолько объекты с лучшими метриками за период
CТолько последний месяц наблюдений, чтобы не было шума
DИсторический список всех объектов за период, включая закрытые/ушедшие, с единым правилом включения в population
Правильный ответ. Чтобы снизить survivorship bias, нужно включать выбывших и закрытых, а не только «выживших».

Разбор

Смещение появляется, когда из данных исчезают неуспешные объекты и вы анализируете только оставшихся. Полный исторический реестр объектов с правильным определением population позволяет корректнее оценить средние и распределения. Типичная ошибка — использовать удобный «текущий» срез и считать, что он отражает прошлое.

Проверь себя · 1/3разбор после ответа
Вы оцениваете среднюю доходность фондов за 10 лет, используя только фонды, которые существуют сегодня, и игнорируете закрытые фонды. Какой bias наиболее вероятен и в какую сторону?
Тренировать статистику в Telegram

Ещё вопросы по теме «Выборка и смещение»