Собеседование на Data Engineer в Naumen
Содержание:
Почему Naumen — особенный работодатель для DE
Naumen — крупная российская enterprise-SaaS компания: продукты для контакт-центров (Naumen Contact Center, Naumen Erudite), ITSM/BPM-платформы (Naumen Service Desk), CRM, knowledge management, omnichannel, документооборот. Клиенты — преимущественно средний и крупный бизнес, государственные структуры и регулируемые отрасли. Для Data Engineer это enterprise B2B-контекст с серьёзным compliance и длинными циклами проектов.
Главные DE-домены: построение DWH для контакт-центров (звонки, обращения, метрики операторов, AHT/FCR/CSAT); pipeline для AI Erudite (телеметрия LLM-ассистента, RAG-индексы, training data); ITSM-аналитика (тикеты, SLA, эскалация); ASR-pipeline (запись голоса, транскрипция, NLP-классификация); biling enterprise-клиентов; pipeline для compliance (152-ФЗ, ФСТЭК, ГОСТ Р 57580, банковские requirements).
Стек: Oracle (наследие enterprise-клиентов) + PostgreSQL + ClickHouse для аналитики; Kafka + специализированные коннекторы; Airflow + dbt + Spark; data lake для записей звонков и тренировочных данных AI Erudite.
Актуальные вакансии — на hh.ru и сайте Naumen.
Информация основана на публичных источниках и опыте кандидатов. Команды Naumen используют разные процессы — формат и этапы зависят от направления, для compliance-ролей обязательна СБ, уточняйте у рекрутера.
Этапы собеседования
Полный цикл — 4-6 недель, 5-6 этапов. Процесс корпоративный: HR, техническое интервью, кодинг и SQL, архитектурный кейс, поведенческое, финал.
1. HR-скрининг (30-45 минут)
Рекрутер уточняет: production-опыт DE (от 2 лет, желательно с enterprise SaaS или contact-center контекстом), знание стека, мотивацию идти в Naumen, ожидания по компенсации и формату (Москва, Екатеринбург, гибрид). Готовь питч на 90 секунд про самый зрелый production-pipeline.
2. Техническое интервью / SQL и архитектура (60-90 минут)
Базовая секция с senior DE из команды. Темы: SQL deep dive (оконки, оптимизация), модели данных (event-схемы для contact-center, ITSM), batch vs streaming, CDC, data quality. Специфический вопрос: «как ты бы построил pipeline для ASR-данных контакт-центра клиента-банка с compliance-требованиями (запись звонков, transcription, audit trail)».
Подготовка: SQL для DE, Data modeling, Kafka streaming.
3. Python + SQL live coding (60-90 минут)
Задачи прагматичные: 1-2 на SQL (оконки, JOIN, оптимизация), 1-2 на Python (pandas, простые ETL). Часто живой кейс: «дам тебе таблицу звонков и обращений, посчитай AHT и FCR по операторам». Готовиться: 30-50 SQL Medium-Hard задач + 20 простых на Python.
Подготовка: SQL для DE.
4. Архитектурный кейс (90 минут)
Самая характерная секция. Кейс: «спроектируй ASR-pipeline для контакт-центра банка с compliance ФСТЭК», «как ты бы построил retrieval-pipeline для Naumen Erudite (RAG из базы знаний клиента)», «как сделать ITSM-аналитику с SLA-tracking и эскалацией». Нужно: уточнить требования, описать архитектуру, выбрать стек, продумать data quality и compliance, заложить аудит. Сильный сигнал — учёт enterprise-специфики.
Подготовка: Airflow patterns, Monitoring и data quality.
5. Поведенческое + culture fit (45 минут)
С тимлидом или представителем направления. STAR-формат: конфликт с заказчиком (enterprise-клиент), факап в проде, длинный compliance-проект.
6. Финал с руководителем (30 минут)
Финальная встреча: грейд, оффер. Для compliance-ролей — СБ-проверка.
Особенности по командам
Contact-center DWH. Команда строит DWH для контакт-центров клиентов: звонки, обращения, метрики операторов. Стек — ClickHouse + Kafka + Airflow + dbt + интеграция с IVR и телефонией. Челлендж — реальное время для оперативных дашбордов цеха, исторические витрины для аналитики. Подойдёт DE с background в telco или contact-center.
Naumen Erudite (AI и ML-инфраструктура). Команда строит data infrastructure для AI Erudite: RAG-индексы на базе знаний клиентов, training data для fine-tuning, feature store для оператора. Стек — Spark + ClickHouse + кастомные feature-сервисы + интеграция с LLM-провайдерами и vector DB. Подойдёт DE с интересом к ML.
ITSM-аналитика (Naumen Service Desk). Команда занимается pipeline для ITSM: тикеты, SLA, эскалация, базы знаний. Стек — REST + ClickHouse + dbt. Подойдёт DE с background в ITSM или enterprise-аналитике.
ASR-pipeline. Команда работает с pipeline речевых данных: запись звонков, транскрипция (Whisper, NeMo), NLP-классификация. Стек — S3 для записей + Spark + специализированные ML-сервисы. Подойдёт DE с интересом к Speech AI.
Compliance и регуляторика. Команда работает с регуляторными требованиями: 152-ФЗ, ФСТЭК, ГОСТ Р 57580, банковские requirements. Стек — REST + специализированные compliance-инструменты + WORM-хранилища. Подойдёт DE с зрелым compliance-опытом.
Что Naumen ценит в DE
Enterprise-мышление. Naumen работает с крупными клиентами. Compliance, SLA, длинные циклы внедрения — норма.
Опыт работы с регуляторкой. Кандидат, который понимает 152-ФЗ, ФСТЭК, ГОСТ Р 57580 — сильный сигнал.
Документация — критическая часть. В Naumen документация для enterprise-внедрений — это часть продукта.
Weak vs strong на архитектурном кейсе. Слабый ответ: «возьмём Kafka + ClickHouse для ASR-pipeline банка». Сильный ответ: «ASR для банка — это compliance-критичный pipeline. Архитектура: запись звонков из IVR → S3 с шифрованием at-rest и in-transit (WORM-mode для immutability) → батч транскрипция через Whisper в Spark раз в час → результаты в ClickHouse для аналитики + хранение исходников в S3 7+ лет. Доступ только через scoped tokens с audit log каждого access (ФСТЭК-требование). PII-маскирование в транскриптах перед записью в ClickHouse. Reconciliation между количеством звонков в IVR и записями в ClickHouse еженедельно. Для AI Erudite — отдельный pipeline с consent-tracking».
Готовность к корпоративной среде. Naumen — корпоративный B2B.
Self-management. Циклы проектов длинные (3-6 месяцев на внедрение).
Как готовиться: план
За 5-7 недель до планируемого собеса:
- Неделя 1-2 — SQL deep dive и data modeling. Оконные функции, оптимизация. Модели данных для contact-center и ITSM. Прорешай 30 SQL Medium-Hard задач. Параллельно — на Карьернике обнови базу по SQL и Python: 1500+ задач, по 15-20 минут в день, чтобы за месяц закрыть пробелы.
- Неделя 3 — Современный data stack и compliance. Kafka, Airflow, dbt, Spark, GDPR/152-ФЗ, ФСТЭК-обзорно.
- Неделя 4 — Conversational AI и contact-center контекст. Прочитай блог Naumen, статьи Twilio, Genesys, Rasa, Dialogflow. Запомни понятия: IVR, NLU, intent, AHT, FCR, CSAT, RAG.
- Неделя 5 — Архитектурные кейсы. Прорешай 5-6 кейсов: ASR-pipeline с compliance, retrieval для AI Erudite, ITSM-аналитика, contact-center DWH, biling enterprise. Структура — требования → источники → транспорт → процессинг → витрина → SLA → recovery. Airflow patterns.
- Неделя 6-7 — Mocks и behavioral. Mock-интервью, 5-7 STAR-историй: конфликт с заказчиком (enterprise-клиент), факап в проде, длинный compliance-проект.
Частые ошибки
Не понимают enterprise-контекст. Кандидат рассказывает про быстрые продуктовые пилоты. В Naumen внедрение модели у клиента-банка — это 3-6 месяцев с compliance-checks.
Игнорируют compliance. В Naumen с банковскими клиентами и гос-облаком compliance — критическая часть.
Не разбираются в contact-center метриках. «Что такое AHT, FCR, CSAT?» — кандидат теряется.
Игнорируют PII и аудит. В compliance-pipeline нужно PII-маскирование и immutable audit log.
Не задают вопросы про SLA и латентность. На кейсе сразу — стек, а не «какие SLA, какие latency-требования, какой compliance». Это первый фильтр.
Связанные темы
- Собеседование на Data Engineer
- Airflow patterns
- Kafka streaming
- Собеседование на Data Scientist в Naumen
- Собеседование на ML Engineer в Naumen
FAQ
Удалёнка в Naumen для DE?
Гибрид с офисами в Москве и Екатеринбурге. Полная удалёнка возможна для отдельных позиций.
Зарплатные вилки 2026?
Middle DE: 230-360k. Senior: 360-560k. Lead — выше, особенно в AI Erudite и Speech-направлениях.
Нужен ли английский?
Базовый — для документации.
Сколько этапов?
5-6 этапов, 4-6 недель из-за corporate-процессов и compliance.
Реально ли пройти без enterprise-опыта?
На middle-позицию реально, если есть опыт с SaaS или contact-center. Для senior+ enterprise-команд — нужен опыт работы с банками/госорганами.
Какие книги и ресурсы помогут подготовиться?
«Designing Data-Intensive Applications» Мартина Клеппманна, статьи Twilio/Genesys про contact-center, документация Whisper и vector DB (Pinecone, Weaviate, Qdrant). По BPMN — Camunda guides. По SQL и техническому минимуму — задачник Карьерника, на котором можно прокачать оконные функции и SQL для contact-center-метрик (AHT, FCR, CSAT).
Что подчеркнуть на финале в Naumen?
Опыт работы с enterprise-клиентами (банки, госорганы), понимание длинных циклов внедрения, готовность к compliance-нагрузке. Истории про работу с ASR-pipeline, RAG-инфраструктурой для LLM, или regulated data — серьёзный плюс.
Чем работа в Naumen отличается от других SaaS-провайдеров?
Главное отличие — enterprise-фокус с длинными циклами внедрения (3-6 месяцев), серьёзный compliance (152-ФЗ, ФСТЭК), и специализация на contact-center и ITSM. Если хочешь работать с банками и крупными корпорациями, делать AI для разговорных продуктов — Naumen один из лучших вариантов в РФ. Также Naumen — одна из немногих компаний с production-grade ASR/conversational AI стеком.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера — формат и грейды отличаются по командам.