Собеседование на ML Engineer в T1
Содержание:
Почему T1 — особенный работодатель для MLE
T1 — крупная российская IT-консалтинговая группа компаний, один из крупнейших IT-холдингов РФ после реструктуризации 2022-2023 годов. Занимается enterprise IT-проектами для крупных банков, государственных корпораций, ритейла, нефтегаза и промышленности. После ухода западных консалтинговых компаний T1 заняла значимую позицию в сегменте сложных enterprise-внедрений. Для ML-инженера это работа в проектном консалтинге с возможностью охватить разные домены через клиентов.
ML-системы: bespoke-решения под клиента — recommendation (ритейл, FMCG), scoring (банки), churn prediction, computer vision (производство, retail), NLP (госы, корпорации, документы), anti-fraud. Особенность T1 — масштаб клиентов: внедрения у крупнейших российских корпораций.
Стек: Python + Catboost + PyTorch + K8s для deployment + ClickHouse + MLflow. Многое — on-premise у клиента (особенно для госов и крупных банков).
Что важно понимать про работодателя: T1 после реструктуризации (выделение из Сбера в самостоятельную группу) стал одним из главных бенефициаров ухода западных консалтинговых компаний. Это означает быстрый рост, активное наращивание команд, амбициозные проекты по импортозамещению ML-стека у крупных корпораций. Для MLE — это шанс попасть в проекты enterprise-уровня (масштаб клиентов меряется десятками тысяч сотрудников, контракты — миллиардные), но одновременно — высокая нагрузка, частые контексты, и требование к универсальности больше, чем к глубине одной экспертизы. Если хочешь сидеть годами на одной задаче — это не сюда.
Актуальные вакансии — на hh.ru и сайте T1.
Информация основана на публичных источниках и опыте кандидатов. Команды T1 используют разные процессы — уточняйте у рекрутера.
Этапы собеседования
Цикл занимает 3-4 недели и включает 5-6 этапов. T1 — большая консалтинговая компания. Упор на универсальность, client-facing skills, enterprise/on-premise опыт.
1. HR-скрининг (30-45 минут)
Рекрутер проверяет фон: production-опыт ML (1-2+ лет в задачах с реальным трафиком), enterprise / консалтинг background — плюс. Особенно ценится опыт работы с большими банками или госами. Параллельно — мотивация (готовность к проектной модели, ротации по клиентам), компенсационные ожидания, формат работы (часто гибрид, иногда выезды к клиенту). Готовь питч 90 секунд: твоя экспертиза, конкретные модели в проде с цифрами, почему именно консалтинг сейчас.
2. ML-теория (60-90 минут)
Базовая секция. Темы: бустинги (CatBoost, XGBoost — как устроены, разница, когда что), recommendation (collaborative filtering, ALS, two-tower retrieval, learning-to-rank), scoring и credit risk (логистическая регрессия + бустинги, метрики Gini/KS/PSI, обработка несбалансированных классов), CV (CNN, transfer learning, аугментации, основные архитектуры), NLP (embeddings, transformer, NER, классификация). Так как T1 работает с разными доменами, тебя могут спросить про что угодно. Сильный кандидат отвечает с trade-offs и benchmarks; слабый — заученной теорией без объяснения, когда что применять.
Подготовка: ML-теория.
3. Python live coding (60 минут)
Live-кодинг: 2 задачи LeetCode-уровня (Medium-Hard) на алгоритмы + ML pipeline-задача (написать функцию для расчёта метрики, имплементировать stratified train/test split, отладить чужой код с утечкой target между трейном и тестом). Готовиться по LeetCode минимум 3-4 недели, 100+ задач. Это один из главных отсевов в T1, не пренебрегай.
Подготовка: Python для DS.
4. ML System Design (90 минут)
Кейсы: «спроектируй bespoke recommendation для крупного ритейлера с 10 миллионами клиентов», «anti-fraud-система для банка», «CV для контроля качества на производстве». Нужно описать архитектуру с учётом on-premise constraints, обсудить retrieval+ranking, feature engineering, A/B-план, monitoring. Сильный кандидат сразу декомпозирует кейс: бизнес-метрика → данные → модели → infrastructure → monitoring; обсуждает trade-offs latency vs accuracy; учитывает enterprise-ограничения. Слабый — прыгает в «возьмём BERT», не уточняя задачу.
Подготовка: MLOps, Model serving, Feature stores.
5. Production / scale (60 минут)
K8s deployment, on-premise constraints, integration с legacy. Кейсы: как разворачивал модель у банка-клиента, как делал canary/rolling в on-premise K8s, как разруливал инциденты с падением качества модели. Сильный кандидат: «модель в банке X, 100 RPS пиковый, p99 latency < 300ms, fallback на baseline при отказе, monitoring через Prometheus + Grafana, alerts на drift PSI > 0.2, weekly retraining». Слабый — общие слова без цифр.
Подготовка: Monitoring drift, Deployment strategies.
6. Поведенческое + client-facing (45 минут)
С тимлидом и часто руководителем направления. STAR + client-facing scenarios: расскажи про кейс, где ты убедил клиента отказаться от его технического требования; про факап с моделью у клиента и как ты разруливал; про конфликт с командой клиента по приоритетам. В T1 это критичная секция — без client-facing skills в консалтинге расти невозможно.
Особенности по командам
Banking ML. Bespoke-решения для крупных банков: credit scoring, anti-fraud, AML (anti-money-laundering), churn prediction для retail, customer lifetime value моделирование. Особенности: жёсткие требования к интерпретируемости (нужен SHAP / LIME, для AML — explainable rules для compliance), регуляторные ограничения (нельзя использовать определённые признаки), on-premise развёртывание в закрытом банковском контуре. Подойдёт MLE с банковским опытом или интересом к credit risk и compliance.
Retail / FMCG ML. Recommendation для крупных ритейл-сетей (X5, Магнит, Лента), demand forecasting для логистики и закупок, оптимизация выкладки, dynamic pricing. Особенности: масштаб данных (десятки миллионов SKU * клиенты), интеграция с ERP-системами клиента, сезонность и promo-эффекты. Подойдёт MLE с интересом к retail и опытом работы с большими табличными данными.
Industrial ML. CV для контроля качества на производстве (детекция дефектов на конвейере металлургии, химии, машиностроения), predictive maintenance, оптимизация технологических процессов. Часто edge-deployment (модели прямо у оборудования на промышленной площадке). Подойдёт MLE с CV-background и комфортом с industrial-средой.
Government ML. Scoring граждан/организаций, классификация обращений, NLP для документооборота, поиск по правовым базам. Особенности: высочайшие требования к безопасности и конфиденциальности (закрытые контуры, ЕСМ-системы), приоритет надёжности над cutting-edge точностью, длинные согласования. Подойдёт MLE с готовностью работать в закрытой инфраструктуре.
Bespoke / R&D. Универсальная проектная работа: задачи, которые не вписываются в одну вертикаль, R&D под нестандартные требования, прототипы для новых направлений. Самая динамичная команда с самым широким спектром задач. Подойдёт senior MLE, который хочет разнообразия и не боится менять контекст.
Что T1 ценит в MLE
Production ML. Базовое требование. Слабый кандидат показывает Kaggle-кейсы; сильный — production-истории с реальным эффектом на бизнес-метрику. Пример сильной истории: «scoring-модель в банке X, отскор 100k клиентов в день, Gini поднялся с 0.45 до 0.61, конверсия одобрений выросла на 8%, экономика на ручную проверку — 12М рублей в год». Готовь 2-3 таких истории, желательно из разных доменов.
Enterprise / on-premise. Понимание enterprise constraints: закрытый контур, on-premise K8s, ограниченный набор разрешённых библиотек, согласование архитектуры с ИБ-командой клиента, интеграция через REST/SOAP/Kafka с legacy. Слабый кандидат говорит «деплоил в AWS»; сильный — «в одном проекте делал on-premise через airgap, в другом — гибрид с публичным облаком, в третьем — embedded на edge-устройстве».
Bespoke решения. Готовность работать над разными задачами. Слабый кандидат говорит «я узкий специалист по NLP»; сильный — «прошёл 3-4 разных домена, базу подтягиваю за месяц, готов переключаться». T1 — это про универсальность и адаптивность.
K8s. Без K8s — сложно: enterprise-deployment требует понимания K8s (Helm, ConfigMaps, Secrets, NetworkPolicies, RBAC), часто в on-premise-кластерах без managed services. Перед собесом подними хотя бы 1 модель в K8s сам — это сразу видно по ответам на live-discussion.
Client-facing skills. Умение объяснять ML клиенту, проводить discovery-сессии, презентовать результаты C-level. Слабый кандидат говорит «общаюсь только через PM»; сильный — «регулярно провожу демо для CTO/CDTO клиента, объясняю сложное простым языком, обсуждаю trade-offs с бизнесом». В консалтинге без этого навыка нет карьерного роста.
Как готовиться: план
За 6-8 недель до собеседования:
- Неделя 1-2 — Python + ML. LeetCode Medium 30+ задач, разные домены. Параллельно прорешай вопросы по Python, ML и SQL в Карьернике: 1500+ задач с разбивкой по темам, по 10-15 минут в день закрывают пробелы перед собесом. Python для DS, ML-теория.
- Неделя 3 — K8s + Docker. Подними хотя бы 1 модель в K8s.
- Неделя 4 — MLOps + feature stores. MLOps, Feature stores.
- Неделя 5 — System design + enterprise ML. Model serving.
- Неделя 6 — Monitoring + deployment. Monitoring drift.
- Неделя 7-8 — Mocks + behavioral. Mock-интервью, client-facing scenarios.
Частые ошибки
Без enterprise / on-premise опыта. Кандидат всегда работал в product-компании на публичном облаке. На System Design сразу видно: предлагает managed services, которых в банковском контуре нет, не учитывает airgap-ограничения, не понимает работу с закрытыми репозиториями. Что работает: перед собесом подними локально K8s, разверни модель целиком офлайн, разберись с миррорингом репозиториев.
Без bespoke понимания. Кандидат говорит «я узкий специалист»; для консалтинга это слабый сигнал. Что работает: показать историю смены доменов в карьере или явно сказать на собесе, что готов учиться и адаптироваться, привести примеры быстрого освоения нового стека за 1-2 месяца.
Без K8s. «Деплоил через docker-compose» — для production enterprise-ML этого мало. Сильный: «деплоил в K8s с helm, делал rolling updates, понимаю resource limits и HPA, настраивал readiness/liveness probes». Что работает: за 2 недели до собеса поднять локально 1 модель в K8s, сделать deployment с rolling update, мониторинг через Prometheus.
Только notebook. Кандидаты с Jupyter-only валятся на live-coding и system design. Что работает: переписать 1-2 свежих проекта в виде Python-пакетов с тестами и CI, использовать typing, разделить код по модулям.
Слабые client-facing skills. Отвалишься на behavioral. Что работает: подготовить 5-7 STAR-историй про общение с не-техническим заказчиком, про объяснение результатов простым языком, про управление ожиданиями.
Связанные темы
- Собеседование на ML Engineer
- MLOps
- Feature stores
- Model serving
- Monitoring и drift
- Deployment strategies
FAQ
Удалёнка в T1 для MLE?
Гибрид и удалёнка распространены.
Зарплатные вилки 2026?
Middle MLE: 290-440k. Senior: 440-660k.
Английский нужен?
Базовый — желательно.
Сколько этапов?
5-6 этапов, 3-4 недели.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.