Собеседование на Data Scientist в Битрикс24

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему Битрикс24 — особенный работодатель для DS

Битрикс24 — крупнейшая в России collab/CRM/PM-платформа для SMB и среднего бизнеса: миллионы зарегистрированных компаний-клиентов, активная экосистема партнёров и интеграций, продукты от мессенджера и почты до полноценной CRM и автоматизации бизнес-процессов. Для Data Scientist это очень разнообразный SaaS-контекст: задачи распределены между CRM-аналитикой (lead scoring, прогноз сделок), коммуникационной аналитикой (мессенджер, видеосвязь, телефония), документами и базой знаний (поиск, classification), бизнес-процессами (рекомендации шаблонов, автоматизация), а также внутренней аналитикой огромной SaaS-базы.

Главные ML-домены: lead scoring и классификация сделок; NLP для классификации обращений в мессенджере, поиска в базе знаний, sentiment-анализа; recsys полей CRM, шаблонов бизнес-процессов, контактов в видеоконференциях; антифрод на регистрациях и манипуляциях с тарифом; внутренний churn клиентов Битрикс24; LTV-моделирование; прогноз поддержки и нагрузки на службы. Часть моделей — продакшен-сервисы для клиентов, часть — внутренняя аналитика. Из-за широты продукта DS-задачи разнообразные, в отличие от компаний с одним фокусом.

Стек: Python + Catboost + LightGBM + PyTorch для NLP; PostgreSQL, ClickHouse и кастомные системы для аналитики (Битрикс известен своим разнообразием БД); Spark/Hive для тяжёлых вычислений; собственная feature-инфраструктура; MLflow и внутренние инструменты для трекинга; Kubernetes для serving. Команда компактная для масштабов продукта, DS работает плотно с инженерами и продактами разных направлений.

Актуальные вакансии — на hh.ru и сайте Битрикс24.

Информация основана на публичных источниках и опыте кандидатов. Команды Битрикс24 используют разные процессы — формат и этапы зависят от направления и грейда, уточняйте у рекрутера.

Этапы собеседования

Полный цикл — 3-5 недель, 4-5 этапов. Процесс прагматичный, без избыточной бюрократии: HR, ML-теория, кодинг и SQL, продуктовый кейс, финал с командой. Алгоритмическая планка средняя, без LeetCode Hard. Битрикс24 ценит «продуктовое мышление» и понимание SMB-сегмента.

1. HR-скрининг (30-45 минут)

Рекрутер уточняет: production-опыт ML (от 1-2 лет, желательно с табличными данными или NLP), знание SaaS- или CRM-контекста, мотивацию идти именно в Битрикс24, ожидания по компенсации и формату работы (Калининград/Москва, активная удалёнка). Готовь питч на 90 секунд про самый зрелый production-кейс с цифрами.

2. ML-теория и продуктовый ML (60-90 минут)

Базовая секция со старшим DS из направления. Темы: градиентный бустинг (Catboost/LightGBM — почему именно они, регуляризация, обработка категориальных), классические методы (логистическая регрессия с интерпретацией, метрики классификации, дисбаланс), feature engineering для CRM- и event-данных, NLP-база (transformer-архитектура, BERT, RuBERT, классификация, sentiment), recsys-классика (CF, content-based), базовые time-series для прогноза. Спрашивают предметно: «как ты бы построил классификатор интента из мессенджера на смеси текста и медиа», «как сделать lead-scoring для клиентов amoCRM-конкурента Битрикс24, когда у каждого клиента своя воронка».

Подготовка: классическая ML, NLP задачи, метрики модели.

3. Python + SQL live coding (60 минут)

Задачи прагматичные: 1-2 на Python (pandas, базовые алгоритмы), 1-2 на SQL (агрегаты, JOIN, оконные функции). Часто живой кейс: «дам тебе фрейм со сделками и активностями менеджеров, посчитай конверсию по типам обращений и среднее время реакции». Без LeetCode Hard. Готовиться: 20-30 SQL Medium-задач + 30 простых на pandas.

Подготовка: live coding.

4. Продуктовый кейс (60-90 минут)

Основная ставка интервью. Кейс — продуктовый: «спроектируй фичу „предсказание следующей задачи“ в проектном менеджменте Битрикс24», «как ты бы построил классификатор интента в мессенджере, чтобы предлагать готовые ответы», «как оценить эффект новой системы рекомендаций контактов в видеоконференциях на retention». Нужно: уточнить бизнес-метрику, описать данные, выбрать модель, продумать пайплайн (offline vs online), учесть multi-tenant специфику (продукт идёт миллионам компаний). Сильный сигнал — обсуждение разнообразия клиентов (SMB vs средний vs корпорат) и того, как модель работает у каждой группы.

Подготовка: ML system design, feature engineering.

5. Финал с командой / тимлидом (45 минут)

Беседа с тимлидом или представителем команды. Проверяют поведенческие истории (STAR), отношение к продуктовой работе и партнёрской экосистеме, готовность работать в распределённой команде, грейд. Битрикс24 ценит культурный fit и проактивность.

Особенности по командам

CRM и sales ML. Команда строит lead scoring, классификацию сделок, прогноз выручки клиентам как product features. Стек — Python + Catboost + Spark + ClickHouse. Челлендж — multi-tenant: модель идёт к миллионам клиентов разного размера и индустрии, у каждого свои воронки и поля. Подойдёт DS с опытом в B2B-CRM или скоринге.

Communication AI (мессенджер, видео, телефония). Команда занимается NLP-классификацией интентов из мессенджера, sentiment, поиском в чатах, рекомендациями ответов, базовой ASR в видеоконференциях. Стек — PyTorch + transformer-модели + интеграция с LLM-провайдерами + кастомные ASR/TTS. Челлендж — русский разговорный язык, миллионы сообщений в день, требования к latency. Подойдёт DS с NLP/Speech-фоном.

Knowledge & search. Команда строит поиск в документах, базе знаний, базе контактов клиента; classification и tagging документов. Стек — PyTorch + retrieval-модели + ElasticSearch/Vespa. Подойдёт DS с background в поиске или information retrieval.

Process automation и recsys процессов. Команда занимается рекомендациями бизнес-процессов, шаблонов, полей CRM. Стек — Catboost + CF/content-based + bandits для онлайн-оптимизации. Подойдёт DS с background в маркетинг-аналитике или продуктовом ML.

Internal SaaS analytics. Команда внутренних DS: churn клиентов Битрикс24, expansion, NPS, поддержка load prediction. Стек — Catboost + классические методы + кастомные дашборды + Greenplum/ClickHouse. Подойдёт кандидатам с B2B-SaaS background.

Что Битрикс24 ценит в DS

Продуктовое мышление. Кандидат, который рассказывает только про accuracy без перевода в бизнес-эффект, не пройдёт. Битрикс24 продаёт результаты SMB-клиентам, и DS должен думать категориями retention, conversion, time-to-value.

Production-опыт. История про модель в проде с количественным эффектом. «Запустил классификацию интентов в мессенджере на 5М сообщений в день, +15% точность ответов саппорта» — это история.

Multi-tenant и универсальность. Битрикс24 — SaaS на миллионы компаний. Модель должна работать «в среднем» хорошо у всех. Кандидат, который думает только про одну компанию, рассматривается слабее.

Weak vs strong на System Design. Слабый ответ: «обучим один глобальный transformer для рекомендации задач в проектном менеджменте». Сильный ответ: «начну с baseline на CF и rule-based „похожие задачи в этом проекте“. Затем content-based на эмбеддингах задач + Catboost для ранжирования. Multi-tenant вопрос решу разделением: глобальная модель для общих паттернов + per-tenant fine-tune для крупных корпоративных клиентов (у которых N+ месяцев истории). Метрика — не глобальный NDCG, а NDCG разбит по типам клиентов (SMB/средний/корпорат) и по сегментам».

Готовность к разнообразию задач. В Битрикс24 DS работает на стыке: CRM, NLP, communication AI, поиск. Узкоспециализированные кандидаты, которые только в одной области, рассматриваются слабее.

Self-management и проактивность. Команда распределённая, постановка задач не всегда детальная. DS, который теряется без чётких ТЗ, рассматривается слабее.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

За 5-7 недель до планируемого собеса:

  1. Неделя 1-2 — Табличный ML и NLP-база. Catboost (категориальные фичи, регуляризация), логистическая регрессия и её интерпретация, классические NLP-методы, базовые transformer-архитектуры (RuBERT), классификация и sentiment, recsys-база (CF, content-based). Прорешай 1-2 кейса на текстовых и табличных данных. Параллельно — на Карьернике обнови базу по SQL, Python и ML: 1500+ задач, по 15-20 минут в день, чтобы за месяц закрыть пробелы и не путаться в простых вопросах по метрикам и регуляризации.
  2. Неделя 3 — SaaS- и CRM-контекст. Прочитай блоги Битрикс24, Salesforce, HubSpot, Pipedrive. Запомни понятия: воронка продаж, конверсия по этапам, MQL/SQL, customer journey, churn, expansion, ARPA, NRR.
  3. Неделя 4 — Python + SQL live coding. 20-30 SQL Medium-задач, 30 простых на pandas (groupby, merge, оконки).
  4. Неделя 5 — System Design кейсы. Прорешай 5-6 кейсов: lead-scoring multi-tenant, NLP-классификация интента в мессенджере, recsys задач в PM, поиск в базе знаний, churn клиентов SaaS. Структура — бизнес → метрики → данные → модель → multi-tenant вопросы → A/B → мониторинг. ML system design.
  5. Неделя 6-7 — Mocks и behavioral. Mock-интервью, 5-7 STAR-историй: конфликт с продактом, факап в проде, история про быстрый продуктовый пилот, кейс с multi-tenant архитектурой.

Частые ошибки

Не думают про multi-tenant. Кандидат на System Design рисует модель «для одной компании». Битрикс24 — SaaS на миллионы клиентов. Если в ответе нет ни слова про multi-tenant — балл проседает.

Хайпуют LLM на простых задачах. Кандидат предлагает GPT-4 fine-tune для классификации интента из мессенджера. Не упоминает, что для большинства интентов RuBERT или даже логистическая регрессия даст 90% качества в 1% от стоимости.

Не разбираются в SaaS-метриках. «Что такое NRR, expansion, ARPA?» — кандидат теряется. На продуктовом кейсе это сразу видно.

Не задают вопросы про данные. На кейсе сразу — модель, а не «что есть в продукте, какие события собираются, какие пропуски, как мы обрабатываем тексты в чатах». Это первый фильтр.

Не учитывают размер сегмента. Битрикс24 — SaaS с очень разными клиентами (от ИП на 1 человека до больших корпоратов). Кандидат, который проектирует одну модель «для всех», теряет балл.

Связанные темы

FAQ

Удалёнка в Битрикс24 для DS?

Активная удалёнка и гибрид. Битрикс24 исторически работает распределённо, головной офис в Калининграде, команды по России. Для DS полная удалёнка возможна, координация — через регулярные синки.

Зарплатные вилки 2026?

Middle DS: 220-340k. Senior: 340-540k. Lead/Staff — выше. Бонусная схема скромнее, чем в Тинькоффе или Яндексе, но возможны опционы для ключевых позиций.

Нужен ли английский?

Базовый — для документации и статей. Свободного говорящего не требуется, основная команда русскоязычная.

Сколько этапов?

4-5 этапов, 3-5 недель от первого скрининга до оффера. Процесс быстрый, обратная связь приходит без задержек.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера — формат и грейды отличаются по командам.