Собеседование на Data Scientist в ВСК

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему ВСК — особенный работодатель для DS

ВСК (Военно-страховая компания) — один из крупнейших российских страховщиков, исторически близкий к госсектору и силовым ведомствам, что даёт уникальную аудиторию: военные и сотрудники силовых структур плюс крупные корпоративные клиенты (промышленные и инфраструктурные предприятия). Продуктовый портфель — широкий: имущество, авто, медицина, ОСАГО, КАСКО, страхование жизни, ДМС, грузы и финансовые риски. Для Data Scientist это работа в стабильной корпоративной среде с фокусом на регуляторно-чувствительные модели, plus специфический сегмент аудитории, который требует особого подхода в pricing и риск-моделировании.

ML-домены: pricing-моделирование (frequency × severity для основных линий), antifraud в claims, churn prediction, customer LTV, cross-sell, телематика для авто, корпоративная риск-аналитика (особенно сильная в ВСК из-за крупных b2b-контрактов), NLP на текстах claims и обращений. Стек: Python, scikit-learn, CatBoost, R для актуарных задач, PostgreSQL, Oracle (legacy в части систем), Airflow, MLflow.

Актуальные вакансии — на hh.ru и сайте ВСК.

Информация основана на публичных источниках и опыте кандидатов. Команды ВСК используют разные процессы — уточняйте у рекрутера.

Этапы собеседования

Цикл 4–6 недель и включает 5–6 этапов. Процесс корпоративный, ближе к большим банкам, чем к лёгким страховщикам. Несколько технических секций, отдельная продуктовая, отдельная безопасность.

1. HR-скрининг (30–45 минут)

Рекрутер проверяет: production-опыт DS (1.5+ года), причины смены работы, ожидания, готовность работать в корпоративной структуре. Опыт в страховании, банковском скоринге или антифроде — большой плюс. Питч 60–90 секунд.

2. Тестовое задание (3–7 дней)

Часто даётся: датасет с историей полисов и claims, нужно построить модель прогноза страхового случая или скоринг клиента. Особенность ВСК — выбор интерпретируемых подходов оценивается выше «голой» метрики модели.

3. ML / DS-теория (60–90 минут)

С senior DS из команды. Темы: классика (логистическая регрессия, GLM-семейство, бустинги, regularization, calibration), метрики (Gini, KS), survival анализ для churn, основы actuarial math, причинно-следственный анализ. Готовь объяснение выбора между интерпретируемым GLM и более точным бустингом для конкретной страховой задачи.

Подготовка: Классическая ML на собесе, Метрики модели.

4. Python + SQL live-coding (60–90 минут)

Live: 1 алгоритмическая задача (LeetCode Medium-Easy), 1–2 на pandas, 1–2 на SQL по страховым данным. SQL ВСК часто на Oracle-стиле для legacy-систем плюс PostgreSQL для новых витрин — оконные функции, JOIN на полисах / claims, ratio-метрики.

Подготовка: Live-coding, SQL-собес.

5. ML system design + бизнес-кейс (60–90 минут)

Кейсы: «как ты бы построил скоринг для нового продукта», «как обнаружить организованную fraud-группу», «как удержать корпоративного клиента от ухода». Сильные ответы — где обсуждаются интерпретация, регуляторные ограничения и долгосрочная устойчивость модели.

6. Поведенческое + безопасность данных (30–45 минут)

С тимлидом и менеджером. STAR-формат. Дополнительно — проверка готовности работать с чувствительными данными (силовые структуры, корпоративные контракты).

Особенности по командам

Pricing & Underwriting ML. Главная команда: модели частоты и тяжести для розничных и корпоративных продуктов. Тесная связка с актуариями. Челленджи: интерпретация, стабильность, регуляторное соответствие.

Antifraud. Детекция fraud в claims, особенно в авто-страховании и медицине. Mix классики, графовых подходов, NLP. У ВСК особенность — fraud-кейсы по корпоративным контрактам, где суммы больше.

Corporate Risk Analytics. Уникальная для ВСК команда из-за сильного b2b-сегмента: моделирование рисков для крупных корпоративных клиентов (промышленность, транспорт, военная сфера), оценка убыточности портфеля по сегментам, recommendation тарифа для нестандартных рисков. Подойдёт DS с интересом к корпоративной аналитике и сложным сегментам данных.

Churn & Retention. Прогноз отказа от пролонгации, retention-кампании.

Cross-Sell & LTV. Прогноз LTV клиента, propensity-to-buy для дополнительных продуктов.

Health & DMS Analytics. Меньше команда: аналитика медицинских claims, классификация диагнозов и procedure, fraud в медицине. Подойдёт DS с интересом к медицинским данным.

Marketing & Lead Scoring. Меньше команда, чем у крупных банков: атрибуция, прогноз ROI кампаний, скоринг лидов на продукты, оптимизация креативов. Тесная связка с маркетинг- и колл-центр-командами.

Claims Triage & NLP. Работа с текстами заявлений, классификация по типу и сложности, sentiment-анализ обращений клиентов в колл-центр.

Special Lines & Cyber Risk. Уникальная для крупных страховщиков команда: моделирование редких рисков — киберстрахование, страхование морских грузов, ответственности директоров. Сложные tail-распределения, мало исторических данных, активное использование экспертных оценок параллельно с ML.

Что ВСК ценит в DS

Интерпретируемость и устойчивость моделей. В страховании, особенно с корпоративным сегментом, регуляторные и аудиторские проверки регулярны. Strong: модель с monotone constraints, SHAP-объяснениями, стабильностью в разрезах. Weak: чистый бустинг с лучшей AUC без обоснования.

Цифры и бизнес-эффект. «Обучил модель» — не аргумент. Сильный ответ: «обучил CatBoost для прогноза вероятности страхового случая, валидация по календарю и по гео, calibration через Platt; в A/B на 25% портфеля за 90 дней loss-ratio улучшилось на X%, premium retention не пострадал». Цифры обязательны.

Понимание корпоративного сегмента. B2B-страхование — другая природа: длинные контракты, индивидуальный underwriting, нестандартные риски. Кандидат, мыслящий только розничной частотностью, выглядит сыро.

Готовность к корпоративному процессу. ВСК — большая структура с формальными процессами. Способность работать в них — критично.

Опыт работы с чувствительными данными. Понимание ФЗ-152 и специфики данных по силовым структурам — must для middle+.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

Минимум 6–8 недель. Неделя 1–2: ML-теория (классика, GLM, бустинги, calibration, monotone constraints). Неделя 3: LeetCode + pandas (40 задач). Неделя 4: SQL — оконки, ratio, complex JOINs. Неделя 5: actuarial basics (frequency-severity, Tweedie, SHAP). Неделя 6: A/B и interpretability. Неделя 7: ML system design — отработай 4 кейса (pricing, antifraud, corporate risk, churn). Неделя 8: подготовь STAR-истории, mock-интервью.

Для тренировки реальных вопросов с DS-собесов — открывай Карьерник: 1500+ задач по SQL, Python, A/B-тестам, статистике, продуктовой аналитике и ML по темам и сложности.

Частые ошибки

Первая — black-box модель без интерпретации. В страховании с корпоративным сегментом каждое решение по тарифу может быть оспорено клиентом. Без SHAP / PDP / monotone constraints — слабый ответ.

Вторая — игнорирование корпоративного риск-моделирования. ВСК сильно представлен в b2b, и кандидат, фокусирующийся только на retail-моделях, выглядит однобоко.

Третья — слабая работа с регуляторными ограничениями. Дискриминация по чувствительным признакам в моделях — табу.

Четвёртая — нет цифр в бизнес-эффекте. На вопрос про самый успешный проект сильный ответ — с конкретным улучшением loss-ratio.

Пятая — попытка применить чистый ML без учёта actuarial-стороны. Frequency × Severity — основа всего pricing. Strong-кандидат сразу обсуждает выбор между совместной моделью на pure premium (через Tweedie GLM или Gradient Boosting с tweedie-loss) и двухступенчатой архитектурой с отдельными моделями частоты и тяжести; обосновывает выбор данными — концентрацией нулей и тяжестью хвоста распределения убытков.

Шестая — недооценка важности B2B-сегмента. ВСК сильно представлен в корпоративном страховании, и кандидат, фокусирующийся только на retail-моделях, теряет половину разговора. Подготовь хотя бы один кейс на корпоративную аналитику до собеса.

Связанные темы

FAQ

Сколько этапов в собесе DS в ВСК?

5–6 этапов: HR-скрининг, тестовое задание, ML / DS-теория, Python + SQL live-coding, ML system design + бизнес-кейс, поведенческое + безопасность данных. Цикл — 4–6 недель.

Нужен ли опыт работы с государственным сегментом?

Не обязателен, но готовность работать с чувствительными данными и формальными процессами — must.

Чем DS в ВСК отличается от DS в РЕСО или Согласии?

Сильный b2b-сегмент с корпоративными клиентами из промышленности и силовых структур — это даёт уникальные задачи corporate risk analytics. По розничным продуктам — задачи похожи на РЕСО.

Какой английский нужен?

B1–B2 минимум. Часть инструментов и actuarial literature — на английском.

Сколько платят DS в ВСК?

Зависит от грейда. Для middle DS — на уровне средних финтехов, для senior — близко к рынку. Corporate risk и antifraud команды обычно платят выше из-за специфики.

Какие книги/курсы посмотреть до собеса?

Klugman «Loss Models» для actuarial-фундамента, Molnar «Interpretable Machine Learning» для интерпретируемости, плюс смежная литература по банковскому скорингу. Для b2b-направления полезно прочитать обзоры по моделированию катастрофических рисков и Solvency-II как методологии (даже если у нас другие регуляторные рамки, концепции пересекаются).

Берут ли DS без актуарного образования?

Берут. Главное — готовность учить actuarial basics (frequency × severity, GLM, Tweedie) до и после собеса. Сильный ML-фундамент важнее, чем формальное актуарное образование.

Стоит ли переходить из банка в страховую?

Зависит от мотивации. Страхование — более медленный, регуляторный и actuarial-ориентированный мир. Если ты ценишь стабильность процессов и глубину pricing-задач, страхование подойдёт. Если хочется быстрых продуктовых итераций — банк или финтех ближе.

Какой стек чаще встречается в задачах?

Python + scikit-learn + CatBoost для retail-задач, R + GLM для actuarial-задач, ClickHouse + PostgreSQL для аналитики, PyTorch для NLP и CV, Airflow для оркестрации. Oracle встречается в legacy-системах для core-страхования.