Собеседование на Data Engineer в amoCRM

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему amoCRM — особенный работодатель для DE

amoCRM — одна из крупнейших российских sales-CRM для SMB и среднего бизнеса: десятки тысяч активных аккаунтов, миллионы сделок и обращений, активные интеграции с мессенджерами (WhatsApp, Telegram) и телефонией. Для Data Engineer это специфический SaaS-контекст: event-DWH с миллиардами событий (вход/выход сделки по статусам, сообщения, звонки), multi-tenant архитектура, интеграция с десятками мессенджеров и телефонии, собственная B2B-аналитика SaaS-метрик.

Главные DE-домены: построение event-DWH (сделки, статусы воронки, сообщения, звонки, активности менеджеров); pipeline для мессенджер-интеграций (WhatsApp Business API, Telegram Bot API, VK, Viber); CDC из core-БД amoCRM в DWH; pipeline для sales-аналитики (конверсии по воронке, lead-scoring data, CRM-метрики); pipeline для CRM-аналитики клиентов (стандартные дашборды и сегменты); биллинг (расход клиентов по тарифам).

Стек: ClickHouse для аналитики + PostgreSQL для core-данных + Kafka для event-ingestion; Airflow + dbt + Spark; data lake на S3-compatible. Команда DE плотно работает с продуктовыми и инфраструктурными командами.

Актуальные вакансии — на hh.ru и сайте amoCRM.

Информация основана на публичных источниках и опыте кандидатов. Команды amoCRM используют разные процессы — формат и этапы зависят от направления, уточняйте у рекрутера.

Этапы собеседования

Полный цикл — 3-5 недель, 4-5 этапов. Процесс быстрый и прагматичный: HR, техническое интервью, кодинг и SQL, продуктово-архитектурный кейс, финал.

1. HR-скрининг (30-45 минут)

Рекрутер уточняет: production-опыт DE (от 1.5-2 лет, желательно с event-DWH или SaaS-контекстом), знание ClickHouse и Kafka, мотивацию идти в amoCRM, ожидания по компенсации и формату (Москва, активная удалёнка). Готовь питч на 90 секунд про самый зрелый production-pipeline.

2. Техническое интервью / SQL и архитектура (60-90 минут)

Базовая секция с senior DE из команды. Темы: SQL deep dive (оконки, оптимизация на event-данных, ClickHouse-специфика), модели данных (event-схемы для CRM, измерения customer, deal, message), batch vs streaming, CDC (Debezium), data quality. Специфический вопрос: «как ты бы построил CDC из PostgreSQL amoCRM в ClickHouse с гарантией consistency для миллионов аккаунтов».

Подготовка: SQL для DE, ClickHouse и OLAP, CDC и event sourcing.

3. Python + SQL live coding (60 минут)

Задачи прагматичные: 1-2 на SQL (оконки, JOIN, оптимизация — часто на event-данных), 1-2 на Python (pandas, простые ETL). Часто живой кейс: «дам тебе таблицу сделок и событий, посчитай среднее время сделки в воронке по этапам и конверсии». Готовиться: 30-50 SQL Medium-Hard задач + 20 простых на Python.

Подготовка: SQL для DE.

4. Продуктово-архитектурный кейс (60-90 минут)

Самая характерная секция. Кейс: «спроектируй CDC из PostgreSQL в ClickHouse для всех аккаунтов amoCRM», «как ты бы построил event-pipeline для входящих сообщений из 5 мессенджеров», «как сделать антифрод-pipeline на регистрациях и пробных периодах». Нужно: уточнить требования, описать архитектуру, выбрать стек, продумать idempotency и обратную совместимость, заложить аудит. Сильный сигнал — учёт SMB-специфики и multi-tenant.

Подготовка: Airflow patterns, ClickHouse и OLAP.

5. Финал с тимлидом / руководителем направления (45 минут)

Беседа с тимлидом, грейд, оффер.

Особенности по командам

Event-DWH и CRM-аналитика. Команда строит event-DWH для CRM: сделки, статусы, активности менеджеров. Стек — Kafka + ClickHouse + Airflow + dbt + Spark. Челлендж — миллионы аккаунтов, schema-evolution с custom-полями клиентов. Подойдёт DE с background в event-DWH.

Messenger-интеграции и event-pipeline. Команда занимается integration с мессенджерами: WhatsApp Business, Telegram, VK, Viber. Стек — Kafka + специализированные коннекторы к мессенджерам. Челлендж — разные API, rate limiting платформ, idempotency для webhook'ов. Подойдёт DE с интересом к интеграционным проектам.

Sales-аналитика и lead scoring data. Команда строит pipeline для sales-аналитики: воронки, конверсии, lead scoring data для ML-моделей. Стек — Spark + ClickHouse + ML-сервисы. Подойдёт DE с product analytics или ML-инфраструктура фоном.

Биллинг и финансовое DWH. Команда отвечает за биллинг клиентов amoCRM по тарифам. Стек — Greenplum + Airflow + dbt + интеграция с финансовой системой. Подойдёт DE с financial-DWH опытом.

Антифрод и trust. Команда строит pipeline антифрода на регистрациях, пробных периодах, манипуляциях. Стек — Kafka + ClickHouse + графовые методы + ML-сервисы. Подойдёт DE с антифрод-background.

Что amoCRM ценит в DE

Production-опыт. История про pipeline в проде на миллионах событий в день. «Запустил CDC из PostgreSQL amoCRM в ClickHouse с T+1 SLA на 100К аккаунтов» — это история.

Знание ClickHouse — большой плюс. Опыт с MergeTree, материализованными представлениями, sequenceCount, retention.

Понимание CRM и sales-метрик. Что такое воронка, lead, deal, conversion, MQL/SQL, retention в B2B — базовый словарь.

Weak vs strong на архитектурном кейсе. Слабый ответ: «возьмём Debezium → Kafka → ClickHouse». Сильный ответ: «CDC из PostgreSQL amoCRM в ClickHouse — это не просто Debezium. Архитектура: Debezium читает WAL PostgreSQL (logical replication) → события в Kafka с partition по account_id → consumer пишет в ClickHouse с UPSERT-логикой (ReplacingMergeTree для дедупликации, потому что Debezium может отправлять дубли при сбоях). Для каждого account_id — изолированный поток обработки. Schema-evolution через Schema Registry с гарантией обратной совместимости. Reconciliation между PostgreSQL и ClickHouse еженедельно с алертами на расхождение более 0.01%. Для миллионов аккаунтов — partitioning по account_id range и time для эффективного pruning».

Готовность к быстрому темпу. amoCRM любит быстрые продуктовые релизы.

Self-management. Команда исторически распределённая.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

За 4-6 недель до планируемого собеса:

  1. Неделя 1-2 — SQL deep dive и ClickHouse. Оконные функции, рекурсивные CTE, оптимизация на event-таблицах, ClickHouse-специфика (MergeTree, ReplacingMergeTree, материализованные представления). Прорешай 30 SQL Medium-Hard задач + 15 ClickHouse-специфичных. Параллельно — на Карьернике обнови базу по SQL и Python: 1500+ задач, по 15-20 минут в день, чтобы за месяц закрыть пробелы.
  2. Неделя 3 — CDC и стрим-stack. Debezium для CDC, Kafka (topics, partitions, exactly-once), Schema Registry, обработка JSON-payload событий.
  3. Неделя 4 — CRM и sales контекст. Прочитай блоги amoCRM, Salesforce, HubSpot. Запомни понятия: воронка, lead, deal, conversion, MQL/SQL, churn в B2B-SaaS.
  4. Неделя 5 — Архитектурные кейсы. Прорешай 5-6 кейсов: CDC из PostgreSQL в ClickHouse multi-tenant, event-pipeline мессенджеров, антифрод на регистрациях, биллинг multi-tenant, lead scoring data pipeline. Структура — требования → источники → транспорт → процессинг → витрина → SLA. Airflow patterns.
  5. Неделя 6 — Mocks и behavioral. Mock-интервью, 5-7 STAR-историй: конфликт с продактом, факап CDC, длинная миграция, история про reconciliation.

Частые ошибки

Не знают ClickHouse и ReplacingMergeTree. В amoCRM это базовый стек для дедупликации Debezium-событий.

Игнорируют idempotency. В CDC retry — обязательная часть. Кандидат, который не упоминает — теряет балл.

Не разбираются в CRM-метриках. «Что такое lead, deal, conversion?» — кандидат теряется.

Игнорируют ограничения мессенджеров. WhatsApp Business имеет лимиты на messaging templates, Telegram — на bot rate limiting.

Не задают вопросы про объёмы и SLA. На кейсе сразу — стек, а не «сколько событий, какие SLA, какой retention». Это первый фильтр.

Связанные темы

FAQ

Удалёнка в amoCRM для DE?

Активная удалёнка и гибрид. amoCRM исторически работает в распределённом режиме.

Зарплатные вилки 2026?

Middle DE: 220-340k. Senior: 340-540k. Lead — выше.

Нужен ли английский?

Базовый — для документации WhatsApp Business, Telegram API. Свободного говорящего обычно не требуется.

Сколько этапов?

4-5 этапов, 3-5 недель.

Реально ли пройти без CRM-опыта?

Реально на middle-позицию, если есть опыт с CDC или event-DWH. CRM-словарь подучить за 1-2 недели.

Какие книги и ресурсы помогут подготовиться?

«Designing Data-Intensive Applications» Мартина Клеппманна, документация ClickHouse и Debezium, документация WhatsApp Business API, Telegram Bot API, статьи Confluent про event-driven architecture. По SQL и техническому минимуму — задачник Карьерника, на котором можно прокачать оконные функции для интеграционных задач.

Что подчеркнуть на финале в amoCRM?

Опыт работы с CDC и event-DWH, понимание SaaS-метрик, готовность к async-работе в распределённой команде. История про работу с мессенджер-интеграциями (WhatsApp, Telegram) или scaling Debezium — сильный плюс.

Чем работа в amoCRM отличается от Mindbox?

amoCRM — sales CRM с фокусом на SMB, миллионы аккаунтов малого/среднего бизнеса. Mindbox — CDP для retail/e-com с десятками крупных клиентов и миллиардами событий. В amoCRM больше много-маленьких клиентов, в Mindbox — мало-больших. Архитектура multi-tenant решается по-разному. Если хочешь работать с CDC и интеграцией мессенджеров на масштабе — amoCRM. Если с CDP-аналитикой и ClickHouse-стеком — Mindbox.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера — формат и грейды отличаются по командам.