Собеседование на Data Scientist в amoCRM

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему amoCRM — особенный работодатель для DS

amoCRM — одна из крупнейших российских sales-CRM для SMB и среднего бизнеса: десятки тысяч активных аккаунтов компаний-клиентов, миллионы сделок и обращений в системе, активные интеграции с мессенджерами и телефонией. Для Data Scientist это специфический SaaS-контекст: с одной стороны — много продуктового ML (lead scoring, классификация сделок, recsys полей), с другой — собственная B2B-аналитика SaaS-бизнеса (churn клиентов amoCRM, NPS, expansion, MRR). Команда меньше, чем в банке или e-com, поэтому DS работает плотно с продактами и инженерами и видит проект «от и до».

Главные ML-домены: lead scoring и классификация сделок (вероятность сделки, ожидаемый средний чек, сегмент клиента); sales-аналитика и прогноз выручки клиентам (для самих SMB-компаний, как сервис); NLP для обработки переписок в мессенджерах (определение интента, классификация ответа, sentiment); next-best-action для продавцов; антифрод на регистрациях и манипуляциях с пробным периодом; внутренний churn клиентов amoCRM; LTV-моделирование; recsys полей и шаблонов сценариев; иногда — генерация контента ответов через LLM. Часть моделей — это продакшен-сервисы для клиентов, часть — внутренняя аналитика.

Стек: Python + Catboost + LightGBM + PyTorch для NLP-задач; PostgreSQL + ClickHouse для аналитики; Spark/Hive для тяжёлых вычислений; собственная feature-инфраструктура; MLflow flavor для трекинга; Kubernetes для serving. Команда компактная, инструменты подбираются под задачу.

Актуальные вакансии — на hh.ru и сайте amoCRM.

Информация основана на публичных источниках и опыте кандидатов. Команды amoCRM используют разные процессы — формат и этапы зависят от направления и грейда, уточняйте у рекрутера.

Этапы собеседования

Полный цикл — 3-5 недель, 4-5 этапов. Процесс быстрый и прагматичный, без избыточной бюрократии: HR, ML-теория, кодинг и SQL, продуктовый кейс, финал с командой. Алгоритмическая планка средняя, без LeetCode Hard. amoCRM известен короткими циклами и продуктовым подходом к найму.

1. HR-скрининг (30-45 минут)

Рекрутер уточняет: production-опыт ML (от 1-2 лет, желательно с табличными данными или NLP), знание SaaS-контекста, мотивацию идти именно в amoCRM, ожидания по компенсации и формату работы (Москва, активная удалёнка), готовность к продуктовой работе с клиентами. amoCRM ценит «продуктовое мышление». Готовь питч на 90 секунд про самый зрелый production-кейс с цифрами.

2. ML-теория и продуктовый ML (60-90 минут)

Базовая секция со старшим DS из команды. Темы: градиентный бустинг (Catboost/LightGBM — почему именно они для табличных данных, регуляризация, обработка категориальных), классические методы (логистическая регрессия с интерпретацией коэффициентов — критично для разговора с продактами и сейлами, метрики классификации, ROC-AUC vs PR-AUC при дисбалансе), feature engineering для sales-данных и сделок, time-series (прогноз выручки клиента, базы), NLP (transformer-архитектура, BERT, классификация интента, sentiment, базовая обработка русского языка), recsys-базы (CF, content-based). Спрашивают предметно: «как ты бы построил lead-scoring для разных типов SMB-клиентов с очень разной выборкой».

Подготовка: классическая ML, NLP задачи, метрики модели.

3. Python + SQL live coding (60 минут)

Задачи прагматичные, без LeetCode Hard: 1-2 на Python (pandas, базовые алгоритмы), 1-2 на SQL (агрегаты, JOIN, оконные функции). Часто живой кейс: «дам тебе фрейм со сделками клиентов, посчитай конверсию по этапам воронки и среднее время на каждом этапе». Готовиться: 20-30 SQL Medium-задач + 30 простых на pandas.

Подготовка: live coding.

4. Продуктовый кейс (60-90 минут)

Основная ставка интервью. Кейс — продуктовый или бизнес: «спроектируй lead-scoring как фичу продукта, чтобы менеджеры по продажам клиентов amoCRM видели, какая сделка вероятнее закроется», «как ты бы построил NLP-классификацию интента из переписок в WhatsApp», «как оценить эффект новой фичи „предлагаемое следующее действие“ на closeable-rate». Нужно: уточнить бизнес-метрику, описать данные (что есть в стандартной интеграции), выбрать модель, продумать пайплайн (offline vs online), учесть multi-tenant специфику (модель идёт к десяткам тысяч аккаунтов). Сильный сигнал — обсуждение fairness между клиентами разного размера и типа.

Подготовка: ML system design, A/B и causal.

5. Финал с командой / тимлидом (45 минут)

Беседа с тимлидом или представителем команды. Проверяют поведенческие истории (STAR), отношение к продуктовой работе с клиентами, готовность работать в распределённой команде, грейд. amoCRM ценит культурный fit и проактивность.

Особенности по командам

Sales ML и продуктовые модели. Команда строит lead scoring, классификацию сделок, прогноз выручки как product features. Стек — Python + Catboost + Spark + ClickHouse. Челлендж — multi-tenant: модель идёт к десяткам тысяч клиентов разного размера и индустрии. Подойдёт DS с опытом в B2B-CRM, скоринге или маркетинг-аналитике.

NLP и обработка переписок. Команда занимается классификацией интента, sentiment, тегированием ответов, поиском дубликатов в переписках. Стек — PyTorch + transformer-модели + интеграция с LLM-провайдерами. Челлендж — русский разговорный язык, миллионы сообщений в день, требования к latency. Подойдёт DS с NLP-фоном и интересом к разговорным AI-сервисам.

Internal SaaS analytics. Команда внутренних DS: churn клиентов amoCRM, expansion, NPS-аналитика, MRR-моделирование, support load prediction. Стек — Catboost + классические методы + кастомные дашборды + Greenplum/ClickHouse. Подойдёт кандидатам с B2B-SaaS background или CRM-фоном.

Next-best-action и автоматизация. Команда строит рекомендации действий менеджеру (предложи скидку, отправь шаблон, перезвони в X дней). Стек — Catboost + bandits + кастомные business-rules. Челлендж — обучение в условиях live-deployment у тысяч клиентов одновременно. Подойдёт DS с background в маркетинг-аналитике или RL/bandits.

Антифрод и trust. Точечно: детекция фрода на регистрациях, манипуляций с пробным периодом, нарушений ToS. Стек — Python + Catboost + графовые методы. Подойдёт кандидатам с background в антифроде или security.

Что amoCRM ценит в DS

Продуктовое мышление. Кандидат, который рассказывает только про accuracy без перевода в бизнес-эффект (увеличение close-rate, снижение времени на сделку), не пройдёт.

Production-опыт. История про модель в проде с цифрами. «Сделал классификатор на Kaggle» — не история. «Запустил lead-scoring у клиентов, +12% close-rate в A/B на 4 недели» — это история.

Multi-tenant и универсальность. amoCRM — SaaS на десятки тысяч клиентов. Модель должна работать «в среднем» хорошо у всех. Кандидат, который думает только про одну компанию, рассматривается слабее.

Weak vs strong на System Design. Слабый ответ: «возьмём transformer для классификации интента из переписок». Сильный ответ: «начну с baseline: rule-based + bag-of-words + логистическая регрессия — это уже даст рабочий MVP и инструмент для маркировки. После — fine-tune RuBERT на нашей разметке, но только если на A/B покажет +X% точности при сопоставимом latency. На каждом шаге метрика — не accuracy в среднем, а precision/recall разбит по типам клиентов и индустриям, потому что „средняя по больнице“ маскирует деградацию у клиентов меньшего размера».

Быстрая итерация. amoCRM любит быстрые продуктовые релизы. Кандидаты, которые любят месяцами полировать pipeline без MVP, рассматриваются слабее.

Готовность к work-with-customer. В amoCRM часть DS-работы — это поддержка моделей у конкретных клиентов. Кандидат, который категорически не хочет общаться с продактами и саппортом, рискует.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

За 5-7 недель до планируемого собеса:

  1. Неделя 1-2 — Табличный ML и NLP-база. Catboost (категориальные фичи, регуляризация, ordered boosting), логистическая регрессия и её интерпретация, классические NLP-методы (bag-of-words, TF-IDF), базовые transformer-архитектуры (BERT, RuBERT), классификация интента. Прорешай 1-2 кейса на текстовых данных. Параллельно — на Карьернике обнови базу по SQL, Python и ML: 1500+ задач, по 15-20 минут в день, чтобы за месяц закрыть пробелы и не путаться в простых вопросах про метрики и регуляризацию.
  2. Неделя 3 — SaaS- и sales-контекст. Прочитай блог amoCRM, статьи Salesforce, HubSpot, Pipedrive про lead-scoring и sales-AI. Запомни понятия: воронка продаж, конверсия по этапам, MQL/SQL, ABM, churn, NRR, expansion, lifetime value.
  3. Неделя 4 — Python + SQL live coding. 20-30 SQL Medium-задач на оконки и JOIN, 30 простых на pandas.
  4. Неделя 5 — System Design кейсы. Прорешай 5-6 кейсов: lead-scoring multi-tenant, NLP-классификация интента, next-best-action, антифрод регистраций, churn клиентов SaaS. Структура — бизнес → метрики → данные → модель → multi-tenant вопросы → A/B → мониторинг. ML system design.
  5. Неделя 6-7 — Mocks и behavioral. Mock-интервью, 5-7 STAR-историй: конфликт с продактом, факап в проде, история про быстрый продуктовый пилот, кейс с multi-tenant архитектурой.

Частые ошибки

Не думают про multi-tenant. Кандидат на System Design рисует модель «для одной компании». amoCRM — это SaaS на десятки тысяч аккаунтов. Если в ответе нет ни слова про multi-tenant — балл проседает.

Хайпуют LLM на простых задачах. Кандидат предлагает GPT-4 fine-tune для классификации интента. Не упоминает, что для большинства интентов RuBERT или даже логистическая регрессия даст 90% качества в 1% от стоимости.

Не разбираются в sales-метриках. «Что такое close-rate, MQL, churn, NRR?» — кандидат теряется. На продуктовом кейсе это сразу видно.

Не задают вопросы про данные. На кейсе сразу — модель, а не «что есть в стандартной интеграции, какие события собираются, как мы хешируем тексты переписок, какие пропуски». Это первый фильтр.

Не умеют объяснять бизнес-эффект. amoCRM продаёт результаты сейл-командам клиентов. Кандидат, который не может перевести «AUC 0.78» в «N% больше закрытых сделок», рассматривается слабее.

Связанные темы

FAQ

Удалёнка в amoCRM для DS?

Активная удалёнка и гибрид. amoCRM исторически работает в распределённом режиме, для DS-позиций полная удалёнка возможна. Координация — через регулярные синки с командой.

Зарплатные вилки 2026?

Middle DS: 220-340k. Senior: 340-540k. Lead/Staff — выше. Бонусная схема скромнее, чем в Тинькоффе или Яндексе.

Нужен ли английский?

Базовый — для документации и статей. Свободного говорящего не требуется, основная команда русскоязычная.

Сколько этапов?

4-5 этапов, 3-5 недель от первого скрининга до оффера. Процесс быстрый, обратная связь приходит сразу.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера — формат и грейды отличаются по командам.