Собеседование на Data Scientist в Согласии

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему Согласие — особенный работодатель для DS

Согласие — крупная российская страховая компания с фокусом на корпоративное и розничное страхование: имущество, авто, медицина, финансовые риски. По сравнению с РЕСО или Ингосстрахом размер бизнеса меньше, но это даёт DS уникальное преимущество: компактные команды, прямое влияние на продукт, быстрая итерация. Для Data Scientist это компания, где можно быстро увидеть эффект моделей на бизнесе и плотно работать с актуариями и юристами. Технологически Согласие следует общеотраслевому страховому стандарту — упор на интерпретируемые модели, актуарную математику и regulatory compliance.

ML-домены: pricing-моделирование (частота и тяжесть страхового случая), antifraud в claims, churn prediction для пролонгации, customer LTV и cross-sell, телематика для авто (опционально), NLP на текстах обращений и claims, CV для оценки повреждений (пилотные проекты). Стек: Python, scikit-learn, CatBoost, R для актуарных задач (классический выбор в страховой индустрии), PostgreSQL, Airflow, MLflow, отдельная инфраструктура под актуарную математику.

Актуальные вакансии — на hh.ru и сайте Согласия.

Информация основана на публичных источниках и опыте кандидатов. Команды Согласия используют разные процессы — уточняйте у рекрутера.

Этапы собеседования

Цикл 3–5 недель и включает 4–6 этапов. Процесс корпоративный, но менее формализованный, чем у крупных банков. Меньше формальных секций, больше прямого разговора с командой.

1. HR-скрининг (30–40 минут)

Рекрутер проверяет: production-опыт DS (1+ год), причины смены работы, ожидания, интерес к страхованию. Опыт в финтехе, банковском скоринге или антифроде — большой плюс. Питч 60–90 секунд.

2. Тестовое задание (3–5 дней)

Часто даётся: датасет с историей полисов и claims, нужно построить модель прогноза страхового случая или churn. Сильные кандидаты обсуждают интерпретируемость и стабильность модели в разрезах.

3. ML / DS-теория (60–90 минут)

С senior DS из команды. Темы: классика (логистическая регрессия, GLM, бустинги), метрики бинарной классификации, calibration, survival анализ для churn, основы actuarial math (frequency × severity, GLM с разными распределениями). Готовься объяснять выбор алгоритма под конкретную страховую задачу с обоснованием.

Подготовка: Классическая ML на собесе, ML-теория.

4. Python + SQL live-coding (60 минут)

Live: 1 алгоритмическая задача (LeetCode Easy-Medium), 1–2 на pandas, 1–2 на SQL по страховым данным. SQL обычно классический: оконные функции, ratio-метрики, JOIN на полисах / claims / клиентах.

Подготовка: Live-coding.

5. Бизнес-кейс + продуктовая секция (60–90 минут)

Кейсы: «как ты бы построил pricing для авто-страхования», «как обнаружить подозрительные claims», «как удержать клиента от ухода к конкуренту». Сильные ответы — где обсуждаются интерпретация, регуляторные ограничения, бизнес-эффект.

Подготовка: A/B и causal inference.

6. Поведенческое (30–45 минут)

С тимлидом и менеджером. STAR-формат. Согласие ценит DS, готовых работать в кросс-функциональной команде с актуариями, и умеющих объяснять модели не-тех коллегам.

Особенности по командам

Pricing & Underwriting ML. Главная команда: модели частоты и тяжести страховых случаев для основных продуктов (КАСКО, ОСАГО, имущественное). Тесная связка с актуариями. Челленджи: интерпретируемость, стабильность, регуляторные ограничения. Подойдёт DS с background в banking-scoring или с навыками actuarial math.

Antifraud. Детекция накруток в claims, организованного мошенничества, повторных подделок документов. Mix классики, графовых подходов и NLP. Команда меньше, чем в РЕСО или Ингосстрахе, но задачи аналогичны.

Churn & Retention. Прогноз ухода клиента, оптимизация retention-кампаний, выбор времени для звонка/оффера. Тесная связка с колл-центром и CRM.

Customer Analytics & Cross-Sell. LTV-прогноз, propensity-to-buy для дополнительных продуктов (например, от ОСАГО к КАСКО, от автостраховки к страхованию имущества), оптимизация cross-sell кампаний.

Corporate Risk Analytics. Уникальная для b2b-направления команда: моделирование рисков для корпоративных клиентов (промышленность, агро, транспорт), оценка убыточности портфеля по сегментам. Подойдёт DS с интересом к корпоративной аналитике.

Marketing & Acquisition Analytics. Меньше команда: атрибуция, прогноз ROI кампаний, скоринг лидов на продукты, оптимизация креативов. Тесная связка с маркетингом.

Claims Triage & NLP. Команда работает с текстами заявлений (claims) и обращениями клиентов: классификация, sentiment, выделение ключевых обстоятельств. Подойдёт DS с базовым NLP-background.

Pricing Stability & Monitoring. Меньше команда, но критически важная: мониторинг pricing-моделей в продакшене, обнаружение drift, выявление сегментов, где модель «плывёт». Часть работы — методология валидации и автоматизация мониторинга.

Что Согласие ценит в DS

Интерпретируемость моделей. Регулятор требует объяснимости. Слабый ответ: «бустинг показал лучшую AUC». Strong: «обучил CatBoost с монотонными ограничениями на возраст и стаж водителя, валидация по календарю и по гео, calibration через Platt-scaling, SHAP для объяснения коэффициентов в спорных кейсах; в A/B на 20% контрактов за 90 дней loss-ratio улучшилось на X%». Цифры и обоснование — обязательны.

Стабильность во времени. Страховые модели живут годами. Drift-мониторинг, переобучение, fall-back — стандартные практики.

Понимание actuarial math. Frequency × Severity, GLM-семейство, monotone constraints, Tweedie — приветствуется как фундамент. Кандидат без этого — выглядит сыро для middle+.

Кросс-функциональная работа. Актуарии, юристы, продакты, колл-центр — основные стейкхолдеры. Готовность объяснять модели и слушать ограничения — критично.

Самостоятельность. Команды компактные, DS должен брать задачу и доводить до результата с минимальным надзором.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

Минимум 5–7 недель. Неделя 1–2: ML-теория (классика, бустинги, GLM, calibration). Неделя 3: LeetCode + pandas (40 задач). Неделя 4: SQL — оконки, ratio, retention. Неделя 5: actuarial basics (frequency-severity, Tweedie, monotone constraints, SHAP). Неделя 6: бизнес-кейсы — отработай 4 (pricing, antifraud, churn, cross-sell). Неделя 7: mock-интервью.

Для тренировки реальных вопросов с DS-собесов — открывай Карьерник: 1500+ задач по SQL, Python, A/B-тестам, статистике, продуктовой аналитике и ML по темам и сложности.

Частые ошибки

Первая — black-box модель без интерпретации. На вопрос «как ты объяснишь это юристу» — нет правильного ответа без обсуждения SHAP, monotone constraints и интерпретируемых alternatives.

Вторая — игнорирование actuarial math. Если ты не знаешь, чем frequency-модель отличается от severity, это серьёзный gap.

Третья — слабая работа с регуляторными ограничениями. На некоторые сигналы (например, чувствительные демографические признаки) есть жёсткие ограничения, и DS обязан это понимать.

Четвёртая — нет цифр в кейсах. «Обучил модель» — не аргумент. Strong-кандидат говорит про loss-ratio, retention, премиум до и после.

Пятая — попытка применить e-commerce-recsys к страхованию. Страхование — это контракт на 1 год с low-frequency-взаимодействием, и подходы из e-commerce не работают. Strong-кандидат сразу обсуждает разницу: high-ticket, low-frequency, регуляторные ограничения, long-cycle metrics, и предлагает соответствующий инструментарий — GLM с monotone constraints вместо deep recsys, survival вместо классической retention-модели, propensity score matching для оценки эффекта retention-кампаний.

Шестая — слабая чистота кода в тестовом задании. Согласие, как и другие страховщики, ценит аккуратность процесса больше, чем «голую» метрику модели. Notebook должен читаться последовательно, иметь чёткие шаги исследования данных, обоснование выбора признаков и интерпретацию результатов в бизнес-терминах.

Связанные темы

FAQ

Сколько этапов в собесе DS в Согласии?

4–6 этапов: HR-скрининг, тестовое задание, ML / DS-теория, Python + SQL live-coding, бизнес-кейс + продуктовая секция, поведенческое. Цикл — 3–5 недель.

Нужен ли опыт в страховании?

Желателен, но не обязателен. Сильный опыт в banking-scoring или антифроде подходит. Готовность учить actuarial basics — must.

Чем DS в Согласии отличается от DS в РЕСО?

По задачам — похожи (страховые pricing / antifraud / churn). Согласие меньше по размеру, процессы быстрее, прямого влияния на бизнес больше. РЕСО — крупнее, процессы корпоративнее.

Какой английский нужен?

B1 минимум. Внутренние коммуникации в основном на русском. Часть actuarial literature и инструменты — на английском.

Сколько платят DS в Согласии?

Зависит от грейда. Для middle DS — на уровне средних финтехов, для senior — близко к рынку. Pricing / Antifraud команды обычно платят выше из-за специфики экспертизы.

Какие книги/курсы посмотреть до собеса?

По actuarial-стороне: Klugman «Loss Models». По интерпретируемости моделей: Molnar «Interpretable Machine Learning». По банковскому скорингу как смежной дисциплине: Naeem Siddiqi «Credit Risk Scorecards». Это базовый стек, который часто пересекается со страховой практикой.

Берут ли DS-джунов?

Редко. Чаще — middle и senior. Junior может зайти через тестовое задание и работу на роли аналитика с дорастанием до DS через 1–2 года.

Какой стек чаще встречается в задачах?

Python + scikit-learn + CatBoost — основная рабочая лошадка. R используется для актуарных задач, особенно при работе с GLM-семейством. PostgreSQL и Airflow — стандартный backbone аналитической инфраструктуры. Для NLP-задач — PyTorch и transformers, для графовых задач антифрода — NetworkX и PyG.

Стоит ли менять банк на страховую как DS?

Зависит от мотивации. Страхование даёт более стабильную и медленную работу с актуарной экспертизой; меньше «продуктовых» итераций, больше глубоких pricing-моделей и регуляторного контекста. Если ты любишь медленнее, но глубже, страхование подойдёт.