Собеседование на Data Engineer в amoCRM
Содержание:
Почему amoCRM — особенный работодатель для DE
amoCRM — одна из крупнейших российских sales-CRM для SMB и среднего бизнеса: десятки тысяч активных аккаунтов, миллионы сделок и обращений, активные интеграции с мессенджерами (WhatsApp, Telegram) и телефонией. Для Data Engineer это специфический SaaS-контекст: event-DWH с миллиардами событий (вход/выход сделки по статусам, сообщения, звонки), multi-tenant архитектура, интеграция с десятками мессенджеров и телефонии, собственная B2B-аналитика SaaS-метрик.
Главные DE-домены: построение event-DWH (сделки, статусы воронки, сообщения, звонки, активности менеджеров); pipeline для мессенджер-интеграций (WhatsApp Business API, Telegram Bot API, VK, Viber); CDC из core-БД amoCRM в DWH; pipeline для sales-аналитики (конверсии по воронке, lead-scoring data, CRM-метрики); pipeline для CRM-аналитики клиентов (стандартные дашборды и сегменты); биллинг (расход клиентов по тарифам).
Стек: ClickHouse для аналитики + PostgreSQL для core-данных + Kafka для event-ingestion; Airflow + dbt + Spark; data lake на S3-compatible. Команда DE плотно работает с продуктовыми и инфраструктурными командами.
Актуальные вакансии — на hh.ru и сайте amoCRM.
Информация основана на публичных источниках и опыте кандидатов. Команды amoCRM используют разные процессы — формат и этапы зависят от направления, уточняйте у рекрутера.
Этапы собеседования
Полный цикл — 3-5 недель, 4-5 этапов. Процесс быстрый и прагматичный: HR, техническое интервью, кодинг и SQL, продуктово-архитектурный кейс, финал.
1. HR-скрининг (30-45 минут)
Рекрутер уточняет: production-опыт DE (от 1.5-2 лет, желательно с event-DWH или SaaS-контекстом), знание ClickHouse и Kafka, мотивацию идти в amoCRM, ожидания по компенсации и формату (Москва, активная удалёнка). Готовь питч на 90 секунд про самый зрелый production-pipeline.
2. Техническое интервью / SQL и архитектура (60-90 минут)
Базовая секция с senior DE из команды. Темы: SQL deep dive (оконки, оптимизация на event-данных, ClickHouse-специфика), модели данных (event-схемы для CRM, измерения customer, deal, message), batch vs streaming, CDC (Debezium), data quality. Специфический вопрос: «как ты бы построил CDC из PostgreSQL amoCRM в ClickHouse с гарантией consistency для миллионов аккаунтов».
Подготовка: SQL для DE, ClickHouse и OLAP, CDC и event sourcing.
3. Python + SQL live coding (60 минут)
Задачи прагматичные: 1-2 на SQL (оконки, JOIN, оптимизация — часто на event-данных), 1-2 на Python (pandas, простые ETL). Часто живой кейс: «дам тебе таблицу сделок и событий, посчитай среднее время сделки в воронке по этапам и конверсии». Готовиться: 30-50 SQL Medium-Hard задач + 20 простых на Python.
Подготовка: SQL для DE.
4. Продуктово-архитектурный кейс (60-90 минут)
Самая характерная секция. Кейс: «спроектируй CDC из PostgreSQL в ClickHouse для всех аккаунтов amoCRM», «как ты бы построил event-pipeline для входящих сообщений из 5 мессенджеров», «как сделать антифрод-pipeline на регистрациях и пробных периодах». Нужно: уточнить требования, описать архитектуру, выбрать стек, продумать idempotency и обратную совместимость, заложить аудит. Сильный сигнал — учёт SMB-специфики и multi-tenant.
Подготовка: Airflow patterns, ClickHouse и OLAP.
5. Финал с тимлидом / руководителем направления (45 минут)
Беседа с тимлидом, грейд, оффер.
Особенности по командам
Event-DWH и CRM-аналитика. Команда строит event-DWH для CRM: сделки, статусы, активности менеджеров. Стек — Kafka + ClickHouse + Airflow + dbt + Spark. Челлендж — миллионы аккаунтов, schema-evolution с custom-полями клиентов. Подойдёт DE с background в event-DWH.
Messenger-интеграции и event-pipeline. Команда занимается integration с мессенджерами: WhatsApp Business, Telegram, VK, Viber. Стек — Kafka + специализированные коннекторы к мессенджерам. Челлендж — разные API, rate limiting платформ, idempotency для webhook'ов. Подойдёт DE с интересом к интеграционным проектам.
Sales-аналитика и lead scoring data. Команда строит pipeline для sales-аналитики: воронки, конверсии, lead scoring data для ML-моделей. Стек — Spark + ClickHouse + ML-сервисы. Подойдёт DE с product analytics или ML-инфраструктура фоном.
Биллинг и финансовое DWH. Команда отвечает за биллинг клиентов amoCRM по тарифам. Стек — Greenplum + Airflow + dbt + интеграция с финансовой системой. Подойдёт DE с financial-DWH опытом.
Антифрод и trust. Команда строит pipeline антифрода на регистрациях, пробных периодах, манипуляциях. Стек — Kafka + ClickHouse + графовые методы + ML-сервисы. Подойдёт DE с антифрод-background.
Что amoCRM ценит в DE
Production-опыт. История про pipeline в проде на миллионах событий в день. «Запустил CDC из PostgreSQL amoCRM в ClickHouse с T+1 SLA на 100К аккаунтов» — это история.
Знание ClickHouse — большой плюс. Опыт с MergeTree, материализованными представлениями, sequenceCount, retention.
Понимание CRM и sales-метрик. Что такое воронка, lead, deal, conversion, MQL/SQL, retention в B2B — базовый словарь.
Weak vs strong на архитектурном кейсе. Слабый ответ: «возьмём Debezium → Kafka → ClickHouse». Сильный ответ: «CDC из PostgreSQL amoCRM в ClickHouse — это не просто Debezium. Архитектура: Debezium читает WAL PostgreSQL (logical replication) → события в Kafka с partition по account_id → consumer пишет в ClickHouse с UPSERT-логикой (ReplacingMergeTree для дедупликации, потому что Debezium может отправлять дубли при сбоях). Для каждого account_id — изолированный поток обработки. Schema-evolution через Schema Registry с гарантией обратной совместимости. Reconciliation между PostgreSQL и ClickHouse еженедельно с алертами на расхождение более 0.01%. Для миллионов аккаунтов — partitioning по account_id range и time для эффективного pruning».
Готовность к быстрому темпу. amoCRM любит быстрые продуктовые релизы.
Self-management. Команда исторически распределённая.
Как готовиться: план
За 4-6 недель до планируемого собеса:
- Неделя 1-2 — SQL deep dive и ClickHouse. Оконные функции, рекурсивные CTE, оптимизация на event-таблицах, ClickHouse-специфика (MergeTree, ReplacingMergeTree, материализованные представления). Прорешай 30 SQL Medium-Hard задач + 15 ClickHouse-специфичных. Параллельно — на Карьернике обнови базу по SQL и Python: 1500+ задач, по 15-20 минут в день, чтобы за месяц закрыть пробелы.
- Неделя 3 — CDC и стрим-stack. Debezium для CDC, Kafka (topics, partitions, exactly-once), Schema Registry, обработка JSON-payload событий.
- Неделя 4 — CRM и sales контекст. Прочитай блоги amoCRM, Salesforce, HubSpot. Запомни понятия: воронка, lead, deal, conversion, MQL/SQL, churn в B2B-SaaS.
- Неделя 5 — Архитектурные кейсы. Прорешай 5-6 кейсов: CDC из PostgreSQL в ClickHouse multi-tenant, event-pipeline мессенджеров, антифрод на регистрациях, биллинг multi-tenant, lead scoring data pipeline. Структура — требования → источники → транспорт → процессинг → витрина → SLA. Airflow patterns.
- Неделя 6 — Mocks и behavioral. Mock-интервью, 5-7 STAR-историй: конфликт с продактом, факап CDC, длинная миграция, история про reconciliation.
Частые ошибки
Не знают ClickHouse и ReplacingMergeTree. В amoCRM это базовый стек для дедупликации Debezium-событий.
Игнорируют idempotency. В CDC retry — обязательная часть. Кандидат, который не упоминает — теряет балл.
Не разбираются в CRM-метриках. «Что такое lead, deal, conversion?» — кандидат теряется.
Игнорируют ограничения мессенджеров. WhatsApp Business имеет лимиты на messaging templates, Telegram — на bot rate limiting.
Не задают вопросы про объёмы и SLA. На кейсе сразу — стек, а не «сколько событий, какие SLA, какой retention». Это первый фильтр.
Связанные темы
- Собеседование на Data Engineer
- ClickHouse и OLAP
- CDC и event sourcing
- Собеседование на Data Scientist в amoCRM
- Собеседование на Data Engineer в Mindbox
FAQ
Удалёнка в amoCRM для DE?
Активная удалёнка и гибрид. amoCRM исторически работает в распределённом режиме.
Зарплатные вилки 2026?
Middle DE: 220-340k. Senior: 340-540k. Lead — выше.
Нужен ли английский?
Базовый — для документации WhatsApp Business, Telegram API. Свободного говорящего обычно не требуется.
Сколько этапов?
4-5 этапов, 3-5 недель.
Реально ли пройти без CRM-опыта?
Реально на middle-позицию, если есть опыт с CDC или event-DWH. CRM-словарь подучить за 1-2 недели.
Какие книги и ресурсы помогут подготовиться?
«Designing Data-Intensive Applications» Мартина Клеппманна, документация ClickHouse и Debezium, документация WhatsApp Business API, Telegram Bot API, статьи Confluent про event-driven architecture. По SQL и техническому минимуму — задачник Карьерника, на котором можно прокачать оконные функции для интеграционных задач.
Что подчеркнуть на финале в amoCRM?
Опыт работы с CDC и event-DWH, понимание SaaS-метрик, готовность к async-работе в распределённой команде. История про работу с мессенджер-интеграциями (WhatsApp, Telegram) или scaling Debezium — сильный плюс.
Чем работа в amoCRM отличается от Mindbox?
amoCRM — sales CRM с фокусом на SMB, миллионы аккаунтов малого/среднего бизнеса. Mindbox — CDP для retail/e-com с десятками крупных клиентов и миллиардами событий. В amoCRM больше много-маленьких клиентов, в Mindbox — мало-больших. Архитектура multi-tenant решается по-разному. Если хочешь работать с CDC и интеграцией мессенджеров на масштабе — amoCRM. Если с CDP-аналитикой и ClickHouse-стеком — Mindbox.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера — формат и грейды отличаются по командам.