Собеседование на Data Engineer в Битрикс24
Содержание:
Почему Битрикс24 — особенный работодатель для DE
Битрикс24 — крупнейшая в России collab/CRM/PM-платформа для SMB и среднего бизнеса: миллионы зарегистрированных компаний-клиентов, активная экосистема партнёров и интеграций, продукты от мессенджера и почты до полноценной CRM и автоматизации бизнес-процессов. Для Data Engineer это широчайший продуктовый периметр (CRM + collab + документы + видео + BPM) с массивной event-инфраструктурой и multi-tenant архитектурой.
Главные DE-домены: построение event-DWH для всех продуктовых модулей (CRM, мессенджер, документы, BPM, видеоконференции); CDC из core-баз Битрикс24 в DWH; pipeline для Marketplace разработчиков (метрики приложений); pipeline для recsys и AI-ассистента; биллинг по тарифам с учётом custom fields и Marketplace; pipeline для антифрода и trust; data quality для миллионов клиентов.
Стек: ClickHouse + PostgreSQL + Greenplum + Kafka + Tarantool (наследие VK-стека) для отдельных real-time-витрин; Airflow + dbt + Spark; data lake. Команда DE работает на стыке многих продуктовых направлений.
Актуальные вакансии — на hh.ru и сайте Битрикс24.
Информация основана на публичных источниках и опыте кандидатов. Команды Битрикс24 используют разные процессы — формат и этапы зависят от направления, уточняйте у рекрутера.
Этапы собеседования
Полный цикл — 3-5 недель, 4-5 этапов. Процесс прагматичный с product-fit фокусом: HR, техническое интервью, кодинг и SQL, продуктово-архитектурный кейс, финал.
1. HR-скрининг (30 минут)
Рекрутер уточняет: production-опыт DE (от 1.5-2 лет, желательно с event-DWH или SaaS-контекстом), знание ClickHouse и Kafka, мотивацию идти в Битрикс24, ожидания по компенсации и формату (Калининград, Москва, удалёнка возможна). Готовь питч на 90 секунд про самый зрелый production-pipeline.
2. Техническое интервью / SQL и архитектура (60-90 минут)
Базовая секция с senior DE из команды. Темы: SQL deep dive (оконки, оптимизация на event-данных, ClickHouse-специфика), модели данных (event-схемы, custom fields в CRM, conformed dimensions), batch vs streaming, CDC, data quality. Специфический вопрос: «как ты бы построил unified event-DWH на 10 разных продуктов Битрикс24 (CRM, мессенджер, документы) с разной семантикой событий».
Подготовка: SQL для DE, ClickHouse и OLAP, Kafka streaming.
3. Python + SQL live coding (60 минут)
Задачи прагматичные: 1-2 на SQL (оконки, JOIN, оптимизация), 1-2 на Python (pandas, простые ETL). Часто живой кейс: «дам тебе таблицу аккаунтов и активности модулей, посчитай retention по продуктовым модулям». Готовиться: 30-50 SQL Medium-Hard задач + 20 простых на Python.
Подготовка: SQL для DE.
4. Продуктово-архитектурный кейс (60-90 минут)
Самая характерная секция. Кейс: «спроектируй unified event-DWH для всех модулей Битрикс24», «как ты бы построил pipeline для Marketplace метрик приложений», «как сделать антифрод-pipeline на регистрациях и пробных периодах». Нужно: уточнить требования, описать архитектуру, выбрать стек, продумать schema-evolution и backward compatibility, заложить аудит. Сильный сигнал — учёт широты периметра продукта.
Подготовка: Airflow patterns, ClickHouse и OLAP.
5. Финал с тимлидом / руководителем направления (45 минут)
Беседа с тимлидом, грейд, оффер.
Особенности по командам
Unified event-DWH. Команда строит unified event-DWH для всех продуктовых модулей. Стек — Kafka + ClickHouse + Airflow + dbt. Челлендж — разная семантика событий между CRM, мессенджером, документами; schema-evolution; обратная совместимость для Marketplace. Подойдёт DE с background в multi-product event-DWH.
CDC и core-data pipeline. Команда занимается CDC из core-баз Битрикс24 в DWH. Стек — Debezium + Kafka + ClickHouse. Челлендж — миллионы аккаунтов, custom fields у клиентов. Подойдёт DE с интересом к CDC.
Marketplace data. Команда работает с метриками Marketplace приложений: установки, активные пользователи, выручка разработчиков. Стек — REST + ClickHouse + интеграция с биллингом. Подойдёт DE с background в developer platforms.
Антифрод и trust. Команда строит pipeline антифрода на регистрациях, пробных периодах. Стек — Kafka + ClickHouse + графовые методы + ML-сервисы. Подойдёт DE с антифрод-background.
Биллинг и финансовое DWH. Команда отвечает за биллинг клиентов Битрикс24. Стек — Greenplum + Airflow + dbt. Подойдёт DE с financial-DWH опытом.
Что Битрикс24 ценит в DE
Production-опыт. История про pipeline в проде на миллионах аккаунтов. «Запустил unified event-DWH на 5 продуктовых модулях с T+1 SLA» — это история.
Знание ClickHouse — большой плюс. Опыт с MergeTree, материализованными представлениями, sequenceCount, retention.
Понимание SaaS-метрик. Что такое NRR, ARPA, churn, expansion — базовый словарь.
Weak vs strong на архитектурном кейсе. Слабый ответ: «один big event table со всеми событиями всех модулей». Сильный ответ: «unified event-DWH с core-схемой (account_id, user_id, event_type, timestamp) и product-specific extensions через JSON-payload или partitioned-таблицы. Schema-registry для каждого продуктового модуля с обязательной обратной совместимостью. ClickHouse partitioning по account_id range и time для эффективного pruning. Materialized views для cross-product метрик (например, общий retention по любому модулю). Schema-evolution через явное версионирование событий и graceful миграции».
Готовность к VK-процессам. Кандидаты, которые ругают процессы, получают -1.
Self-management. Команды распределённые.
Как готовиться: план
За 4-6 недель до планируемого собеса:
- Неделя 1-2 — SQL deep dive и ClickHouse. Оконные функции, оптимизация, ClickHouse-специфика. Прорешай 30 SQL Medium-Hard задач. Параллельно — на Карьернике обнови базу по SQL и Python: 1500+ задач, по 15-20 минут в день, чтобы за месяц закрыть пробелы.
- Неделя 3 — CDC и стрим-stack. Debezium, Kafka, Schema Registry, обработка JSON-payload.
- Неделя 4 — SaaS и CRM контекст. Прочитай блоги Битрикс24, Salesforce, HubSpot. Запомни понятия: воронка, lead, deal, custom field, NRR, ARPA.
- Неделя 5 — Архитектурные кейсы. Прорешай 5-6 кейсов: unified event-DWH, CDC multi-tenant, Marketplace metrics pipeline, антифрод, биллинг. Структура — требования → источники → транспорт → процессинг → витрина → SLA. Airflow patterns.
- Неделя 6 — Mocks и behavioral. Mock-интервью, 5-7 STAR-историй: конфликт с продактом, факап CDC, длинная миграция.
Частые ошибки
Не понимают multi-product. Кандидат рисует один большой event table. В Битрикс24 продуктовые модули имеют разную семантику.
Игнорируют backward compatibility. В Marketplace breaking change ломает тысячи приложений.
Не разбираются в SaaS-метриках. «Что такое NRR, ARPA, churn?» — кандидат теряется.
Не задают вопросы про процессы. На кейсе сразу — стек, а не «как мы работаем с продуктовыми командами, как они меняют схему». Это первый фильтр.
Слабая schema-evolution. В Битрикс24 продуктовые команды постоянно добавляют новые события. Кандидат, который этого не закладывает в дизайн — теряет балл.
Связанные темы
- Собеседование на Data Engineer
- ClickHouse и OLAP
- Kafka streaming
- Собеседование на Data Scientist в Битрикс24
- Собеседование на Data Engineer в amoCRM
FAQ
Удалёнка в Битрикс24 для DE?
Активная удалёнка. Битрикс24 исторически работает распределённо, головной офис в Калининграде.
Зарплатные вилки 2026?
Middle DE: 220-360k. Senior: 360-560k. Lead — выше.
Нужен ли английский?
Базовый — для документации.
Сколько этапов?
4-5 этапов, 3-5 недель.
Реально ли пройти без CRM-опыта?
Реально на middle-позицию, если есть опыт с event-DWH или SaaS-аналитикой.
Какие книги и ресурсы помогут подготовиться?
«Designing Data-Intensive Applications», документация ClickHouse и Debezium. По SQL — задачник Карьерника.
Что подчеркнуть на финале в Битрикс24?
Опыт работы с multi-product event-DWH, понимание schema-evolution и backward compatibility, готовность работать с продуктовыми командами разных модулей. Истории про работу с custom fields в DWH или Marketplace метриками — сильный плюс.
Чем работа в Битрикс24 отличается от amoCRM?
Битрикс24 — широкий продуктовый периметр (CRM + collab + документы + мессенджер + видео + BPM). amoCRM — фокус на sales-CRM с мессенджер-интеграциями. В Битрикс24 больше unified event-DWH и schema-evolution; в amoCRM — больше специфичных интеграций с конкретными мессенджерами.
Сколько собесов параллельно вести?
3-4 B2B SaaS-компании (Mindbox, amoCRM, Битрикс24, Naumen, Wrike) — позволяет калибровать офферы. Параллельные собесы в B2B SaaS требуют времени на изучение каждого продукта. Если хочешь работать с broad-product периметром — фокусируйся на Битрикс24. Если с нишевыми вертикалями (CDP, sales CRM, contact-center) — выбирай Mindbox, amoCRM или Naumen.
Какие книги и ресурсы помогут подготовиться?
«Designing Data-Intensive Applications» Мартина Клеппманна, документация ClickHouse и Debezium, статьи Confluent про event-driven architecture. По SQL — задачник Карьерника. Полезно посмотреть доклады с Highload++ про мульти-tenant архитектуры в SaaS.
Реально ли пройти с background из мобильной разработки?
Сложно. DE-роль требует data-инфраструктурного опыта (SQL, DWH, Kafka, ETL). С мобильной разработкой проще идти в продуктовые или CRM-aналитические роли, не в core DE. Если действительно хочешь сменить специализацию — пройди практический онлайн-курс по data engineering с фокусом на ClickHouse и Kafka, выполни 1-2 крупных pet-проекта на event-DWH, и только тогда подавайся.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера — формат и грейды отличаются по командам.