Собеседование на Data Scientist в Согласии
Содержание:
Почему Согласие — особенный работодатель для DS
Согласие — крупная российская страховая компания с фокусом на корпоративное и розничное страхование: имущество, авто, медицина, финансовые риски. По сравнению с РЕСО или Ингосстрахом размер бизнеса меньше, но это даёт DS уникальное преимущество: компактные команды, прямое влияние на продукт, быстрая итерация. Для Data Scientist это компания, где можно быстро увидеть эффект моделей на бизнесе и плотно работать с актуариями и юристами. Технологически Согласие следует общеотраслевому страховому стандарту — упор на интерпретируемые модели, актуарную математику и regulatory compliance.
ML-домены: pricing-моделирование (частота и тяжесть страхового случая), antifraud в claims, churn prediction для пролонгации, customer LTV и cross-sell, телематика для авто (опционально), NLP на текстах обращений и claims, CV для оценки повреждений (пилотные проекты). Стек: Python, scikit-learn, CatBoost, R для актуарных задач (классический выбор в страховой индустрии), PostgreSQL, Airflow, MLflow, отдельная инфраструктура под актуарную математику.
Актуальные вакансии — на hh.ru и сайте Согласия.
Информация основана на публичных источниках и опыте кандидатов. Команды Согласия используют разные процессы — уточняйте у рекрутера.
Этапы собеседования
Цикл 3–5 недель и включает 4–6 этапов. Процесс корпоративный, но менее формализованный, чем у крупных банков. Меньше формальных секций, больше прямого разговора с командой.
1. HR-скрининг (30–40 минут)
Рекрутер проверяет: production-опыт DS (1+ год), причины смены работы, ожидания, интерес к страхованию. Опыт в финтехе, банковском скоринге или антифроде — большой плюс. Питч 60–90 секунд.
2. Тестовое задание (3–5 дней)
Часто даётся: датасет с историей полисов и claims, нужно построить модель прогноза страхового случая или churn. Сильные кандидаты обсуждают интерпретируемость и стабильность модели в разрезах.
3. ML / DS-теория (60–90 минут)
С senior DS из команды. Темы: классика (логистическая регрессия, GLM, бустинги), метрики бинарной классификации, calibration, survival анализ для churn, основы actuarial math (frequency × severity, GLM с разными распределениями). Готовься объяснять выбор алгоритма под конкретную страховую задачу с обоснованием.
Подготовка: Классическая ML на собесе, ML-теория.
4. Python + SQL live-coding (60 минут)
Live: 1 алгоритмическая задача (LeetCode Easy-Medium), 1–2 на pandas, 1–2 на SQL по страховым данным. SQL обычно классический: оконные функции, ratio-метрики, JOIN на полисах / claims / клиентах.
Подготовка: Live-coding.
5. Бизнес-кейс + продуктовая секция (60–90 минут)
Кейсы: «как ты бы построил pricing для авто-страхования», «как обнаружить подозрительные claims», «как удержать клиента от ухода к конкуренту». Сильные ответы — где обсуждаются интерпретация, регуляторные ограничения, бизнес-эффект.
Подготовка: A/B и causal inference.
6. Поведенческое (30–45 минут)
С тимлидом и менеджером. STAR-формат. Согласие ценит DS, готовых работать в кросс-функциональной команде с актуариями, и умеющих объяснять модели не-тех коллегам.
Особенности по командам
Pricing & Underwriting ML. Главная команда: модели частоты и тяжести страховых случаев для основных продуктов (КАСКО, ОСАГО, имущественное). Тесная связка с актуариями. Челленджи: интерпретируемость, стабильность, регуляторные ограничения. Подойдёт DS с background в banking-scoring или с навыками actuarial math.
Antifraud. Детекция накруток в claims, организованного мошенничества, повторных подделок документов. Mix классики, графовых подходов и NLP. Команда меньше, чем в РЕСО или Ингосстрахе, но задачи аналогичны.
Churn & Retention. Прогноз ухода клиента, оптимизация retention-кампаний, выбор времени для звонка/оффера. Тесная связка с колл-центром и CRM.
Customer Analytics & Cross-Sell. LTV-прогноз, propensity-to-buy для дополнительных продуктов (например, от ОСАГО к КАСКО, от автостраховки к страхованию имущества), оптимизация cross-sell кампаний.
Corporate Risk Analytics. Уникальная для b2b-направления команда: моделирование рисков для корпоративных клиентов (промышленность, агро, транспорт), оценка убыточности портфеля по сегментам. Подойдёт DS с интересом к корпоративной аналитике.
Marketing & Acquisition Analytics. Меньше команда: атрибуция, прогноз ROI кампаний, скоринг лидов на продукты, оптимизация креативов. Тесная связка с маркетингом.
Claims Triage & NLP. Команда работает с текстами заявлений (claims) и обращениями клиентов: классификация, sentiment, выделение ключевых обстоятельств. Подойдёт DS с базовым NLP-background.
Pricing Stability & Monitoring. Меньше команда, но критически важная: мониторинг pricing-моделей в продакшене, обнаружение drift, выявление сегментов, где модель «плывёт». Часть работы — методология валидации и автоматизация мониторинга.
Что Согласие ценит в DS
Интерпретируемость моделей. Регулятор требует объяснимости. Слабый ответ: «бустинг показал лучшую AUC». Strong: «обучил CatBoost с монотонными ограничениями на возраст и стаж водителя, валидация по календарю и по гео, calibration через Platt-scaling, SHAP для объяснения коэффициентов в спорных кейсах; в A/B на 20% контрактов за 90 дней loss-ratio улучшилось на X%». Цифры и обоснование — обязательны.
Стабильность во времени. Страховые модели живут годами. Drift-мониторинг, переобучение, fall-back — стандартные практики.
Понимание actuarial math. Frequency × Severity, GLM-семейство, monotone constraints, Tweedie — приветствуется как фундамент. Кандидат без этого — выглядит сыро для middle+.
Кросс-функциональная работа. Актуарии, юристы, продакты, колл-центр — основные стейкхолдеры. Готовность объяснять модели и слушать ограничения — критично.
Самостоятельность. Команды компактные, DS должен брать задачу и доводить до результата с минимальным надзором.
Как готовиться: план
Минимум 5–7 недель. Неделя 1–2: ML-теория (классика, бустинги, GLM, calibration). Неделя 3: LeetCode + pandas (40 задач). Неделя 4: SQL — оконки, ratio, retention. Неделя 5: actuarial basics (frequency-severity, Tweedie, monotone constraints, SHAP). Неделя 6: бизнес-кейсы — отработай 4 (pricing, antifraud, churn, cross-sell). Неделя 7: mock-интервью.
Для тренировки реальных вопросов с DS-собесов — открывай Карьерник: 1500+ задач по SQL, Python, A/B-тестам, статистике, продуктовой аналитике и ML по темам и сложности.
Частые ошибки
Первая — black-box модель без интерпретации. На вопрос «как ты объяснишь это юристу» — нет правильного ответа без обсуждения SHAP, monotone constraints и интерпретируемых alternatives.
Вторая — игнорирование actuarial math. Если ты не знаешь, чем frequency-модель отличается от severity, это серьёзный gap.
Третья — слабая работа с регуляторными ограничениями. На некоторые сигналы (например, чувствительные демографические признаки) есть жёсткие ограничения, и DS обязан это понимать.
Четвёртая — нет цифр в кейсах. «Обучил модель» — не аргумент. Strong-кандидат говорит про loss-ratio, retention, премиум до и после.
Пятая — попытка применить e-commerce-recsys к страхованию. Страхование — это контракт на 1 год с low-frequency-взаимодействием, и подходы из e-commerce не работают. Strong-кандидат сразу обсуждает разницу: high-ticket, low-frequency, регуляторные ограничения, long-cycle metrics, и предлагает соответствующий инструментарий — GLM с monotone constraints вместо deep recsys, survival вместо классической retention-модели, propensity score matching для оценки эффекта retention-кампаний.
Шестая — слабая чистота кода в тестовом задании. Согласие, как и другие страховщики, ценит аккуратность процесса больше, чем «голую» метрику модели. Notebook должен читаться последовательно, иметь чёткие шаги исследования данных, обоснование выбора признаков и интерпретацию результатов в бизнес-терминах.
Связанные темы
- Собеседование на Data Scientist в РЕСО
- Собеседование на Data Scientist в Альфа-Банке
- Собеседование на ML Engineer в Согласии
- Собеседование на Data Scientist — гайд
FAQ
Сколько этапов в собесе DS в Согласии?
4–6 этапов: HR-скрининг, тестовое задание, ML / DS-теория, Python + SQL live-coding, бизнес-кейс + продуктовая секция, поведенческое. Цикл — 3–5 недель.
Нужен ли опыт в страховании?
Желателен, но не обязателен. Сильный опыт в banking-scoring или антифроде подходит. Готовность учить actuarial basics — must.
Чем DS в Согласии отличается от DS в РЕСО?
По задачам — похожи (страховые pricing / antifraud / churn). Согласие меньше по размеру, процессы быстрее, прямого влияния на бизнес больше. РЕСО — крупнее, процессы корпоративнее.
Какой английский нужен?
B1 минимум. Внутренние коммуникации в основном на русском. Часть actuarial literature и инструменты — на английском.
Сколько платят DS в Согласии?
Зависит от грейда. Для middle DS — на уровне средних финтехов, для senior — близко к рынку. Pricing / Antifraud команды обычно платят выше из-за специфики экспертизы.
Какие книги/курсы посмотреть до собеса?
По actuarial-стороне: Klugman «Loss Models». По интерпретируемости моделей: Molnar «Interpretable Machine Learning». По банковскому скорингу как смежной дисциплине: Naeem Siddiqi «Credit Risk Scorecards». Это базовый стек, который часто пересекается со страховой практикой.
Берут ли DS-джунов?
Редко. Чаще — middle и senior. Junior может зайти через тестовое задание и работу на роли аналитика с дорастанием до DS через 1–2 года.
Какой стек чаще встречается в задачах?
Python + scikit-learn + CatBoost — основная рабочая лошадка. R используется для актуарных задач, особенно при работе с GLM-семейством. PostgreSQL и Airflow — стандартный backbone аналитической инфраструктуры. Для NLP-задач — PyTorch и transformers, для графовых задач антифрода — NetworkX и PyG.
Стоит ли менять банк на страховую как DS?
Зависит от мотивации. Страхование даёт более стабильную и медленную работу с актуарной экспертизой; меньше «продуктовых» итераций, больше глубоких pricing-моделей и регуляторного контекста. Если ты любишь медленнее, но глубже, страхование подойдёт.