Собеседование на ML Engineer в БКС
Содержание:
Почему БКС — особенный работодатель для MLE
БКС — крупная российская финансовая группа, известная под брендом «БКС Мир Инвестиций». Включает брокерский бизнес (один из лидеров по числу активных клиентов и обороту), банк (БКС Банк) и доверительное управление. После 2022 года БКС перераспределил свой бизнес и сильно вырос в розничном брокеридже благодаря ограничениям западных конкурентов. Для ML-инженера это работа в финансовом институте с миксом transactional brokerage data, market data, behaviour клиентов.
ML-системы: scoring клиентов (для маржинальной торговли, premium-предложений), recommendation инвестидей (какие активы и стратегии показать клиенту), robo-advisor (автоматическое управление портфелями для retail), NLP для аналитики рынков (анализ новостей, отчётности, sentiment), anti-fraud, AML (anti-money laundering), churn prediction. Финансовая среда требует объяснимости моделей и regulator compliance.
Стек: Python + Catboost для табличных задач + PyTorch для нейросетей (NLP, sequence) + K8s для deployment + ClickHouse как аналитический движок + Hadoop для тяжёлых ETL на market data + MLflow для трекинга экспериментов.
Актуальные вакансии — на hh.ru и сайте БКС.
Информация основана на публичных источниках и опыте кандидатов. Команды БКС используют разные процессы — уточняйте у рекрутера.
Этапы собеседования
Цикл занимает 3-4 недели и включает 5-6 этапов. БКС — большая финансовая компания с структурированными HR-процедурами. Упор на production ML и financial domain.
1. HR-скрининг (30-45 минут)
Рекрутер проверяет фон: production-опыт ML, brokerage / fintech / asset management background — большой плюс. Готовь питч на 90 секунд: проекты, бизнес-эффект, стек. Если работал в banking, brokerage, asset management — упомяни сразу.
2. ML-теория (60-90 минут)
Базовая секция с ведущим ML-инженером. Темы: градиентный бустинг (CatBoost), time series (ARIMA, Prophet, GARCH), market forecasting (sentiment-driven models, market microstructure), recommendation (CF, two-tower). Будь готов рассказать про explainability — для финансов критично (SHAP, monotonic constraints).
Подготовка: ML-теория.
3. Python live coding (60 минут)
Live-кодинг: 1-2 задачи на алгоритмы (LeetCode Medium), плюс задача на ML-pipeline — написать функцию для расчёта Sharpe / max drawdown, реализовать sampling без data leakage в time series. Готовиться по LeetCode минимум 3-4 недели.
Подготовка: Python для DS.
4. ML System Design (90 минут)
Кейсовая секция. Кейсы уровня «спроектируй recommendation инвестидей для retail», «robo-advisor pipeline для автоматического портфеля», «churn prediction для активных трейдеров». Нужно: уточнить бизнес-метрику и regulatory constraints, описать архитектуру, выбрать модели с explainability, продумать compliance.
Подготовка: MLOps, Model serving, Feature stores.
5. Production / scale (60 минут)
Секция про инфраструктуру: K8s deployment, low-latency inference (особенно для рекомендаций в моменте торговой сессии), мониторинг. Кейсы про откат, drift, инциденты.
Подготовка: Monitoring drift, Deployment strategies.
6. Поведенческое (45 минут)
С тимлидом и/или представителем команды. STAR-формат: конфликт с продактом, факап с моделью, спор по compliance. БКС ценит инженерную аккуратность и понимание финансового домена.
Особенности по командам
Recommendation. Recsys инвестидей: какому клиенту показать какие акции, ETF, стратегии. Сложность — длинный feedback loop (клиент решает медленно), регуляторные ограничения на маркетинг финансовых продуктов, важность risk-profile клиента. Подойдёт тем, у кого есть recsys-опыт.
Robo-advisor. Автоматическое управление портфелями для retail-клиентов с заданным риск-профилем. ML-системы строят оптимальные портфели, ребалансируют, адаптируют под рынок. Стек включает modern portfolio theory + ML для signal generation. Подойдёт MLE с quantitative-background.
Churn / Retention ML. Прогноз оттока активных трейдеров и снижения транзакционной активности. ML-driven CRM-кампании. Тесная работа с маркетингом и продактами.
Anti-fraud. Детекция подозрительных операций, AML, KYC. Высокие требования к explainability — каждое решение должно быть аудируемо. Подойдёт тем, у кого опыт в banking anti-fraud.
Market NLP. Аналитика новостей, отчётности эмитентов, sentiment экспертных постов. ML-модели для классификации event types (earnings, M&A, regulatory), summarization, named entity extraction. Подойдёт тем, у кого опыт в финансовом NLP.
Что БКС ценит в MLE
Production ML. Базовое требование. Слабый — «делал на Kaggle»; сильный — «recommendation инвестидей для 100k активных клиентов, +12% engagement в pilot, deploy через K8s».
Brokerage / fintech context. Понимание особенностей brokerage: short-term feedback (трейдинг), regulator compliance, важность explainability. Если в финансах не работал — изучи блоги Tinkoff Engineering, Bloomberg.
Time series. ARIMA, GARCH, Prophet, ML для time series. Без time series-опыта пройти ML-теорию сложно.
K8s. Без K8s сложно. Хотя бы 1 модель сам в K8s подними.
Catboost / PyTorch / Python. Стандарт. Без свежей практики не пройдёшь live-coding.
Как готовиться: план
За 6-8 недель до собеседования:
- Неделя 1-2 — Python + ML + time series. LeetCode Medium 30+ задач, time series, бустинги, recsys. Параллельно прорешай вопросы по Python, ML и SQL в Карьернике: 1500+ задач с разбивкой по темам, по 10-15 минут в день закрывают пробелы перед собесом. Python для DS, ML-теория.
- Неделя 3 — K8s + Docker. Подними хотя бы 1 модель в K8s.
- Неделя 4 — MLOps + feature stores. MLOps, Feature stores.
- Неделя 5 — System design + brokerage ML. Кейсы recommendation, robo-advisor, churn. Model serving.
- Неделя 6 — Monitoring + deployment. Drift, compliance, canary. Monitoring drift.
- Неделя 7-8 — Mocks + behavioral. Mock-интервью, 5-7 STAR-историй.
Частые ошибки
Без brokerage / fintech domain. Кандидат говорит «у меня e-commerce» — на System Design отвалится. Сильный — «изучил brokerage-аналитику, понимаю transactional patterns, regulatory framework».
Без time series. Кандидат говорит «делал классификацию» — слабо. Сильный — «работал с time series, разделял train/test без data leakage, использовал lagged features».
Без K8s. «Деплоил через docker-compose» — слабо для финансового production. Сильный — «деплоил через K8s, использовал HPA, canary».
Только notebook. Кандидаты с Jupyter-only валятся. Сильный — «свои проекты переписал в виде пакетов с тестами».
Без production опыта. «У нас была модель» — не история. Сильный — «модель churn на 200k активных трейдеров, AUC=0.83, deploy через K8s, мониторил drift и retraining ежемесячно».
Связанные темы
- Собеседование на ML Engineer
- MLOps
- Feature stores
- Model serving
- Monitoring и drift
- Deployment strategies
FAQ
Удалёнка в БКС для MLE?
Гибрид и удалёнка распространены. Офисы — в Москве.
Зарплатные вилки 2026?
Middle MLE: 300-450k. Senior: 450-670k.
Английский нужен?
Базовый — желательно. Свободный — не обязателен для большинства команд.
Сколько этапов?
5-6 этапов, 3-4 недели.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.