15 мая 2026 г.·9 мин чтения

Собеседование на Data Engineer в Naumen

Проверь себя · 1/3разбор после ответа

Для каждой покупки пользователя нужно добавить дату следующей покупки этого же пользователя, чтобы потом посчитать интервал между покупками. Что использовать?

Содержание:

Почему Naumen — особенный работодатель для DE
Этапы собеседования
Особенности по командам
Что Naumen ценит в DE
Как готовиться: план
Частые ошибки
Связанные темы
FAQ

Почему Naumen — особенный работодатель для DE

Naumen — крупная российская enterprise-SaaS компания: продукты для контакт-центров (Naumen Contact Center, Naumen Erudite), ITSM/BPM-платформы (Naumen Service Desk), CRM, knowledge management, omnichannel, документооборот. Клиенты — преимущественно средний и крупный бизнес, государственные структуры и регулируемые отрасли. Для Data Engineer это enterprise B2B-контекст с серьёзным compliance и длинными циклами проектов.

Главные DE-домены: построение DWH для контакт-центров (звонки, обращения, метрики операторов, AHT/FCR/CSAT); pipeline для AI Erudite (телеметрия LLM-ассистента, RAG-индексы, training data); ITSM-аналитика (тикеты, SLA, эскалация); ASR-pipeline (запись голоса, транскрипция, NLP-классификация); biling enterprise-клиентов; pipeline для compliance (152-ФЗ, ФСТЭК, ГОСТ Р 57580, банковские requirements).

Стек: Oracle (наследие enterprise-клиентов) + PostgreSQL + ClickHouse для аналитики; Kafka + специализированные коннекторы; Airflow + dbt + Spark; data lake для записей звонков и тренировочных данных AI Erudite.

Актуальные вакансии — на hh.ru и сайте Naumen.

Информация основана на публичных источниках и опыте кандидатов. Команды Naumen используют разные процессы — формат и этапы зависят от направления, для compliance-ролей обязательна СБ, уточняйте у рекрутера.

Этапы собеседования

Полный цикл — 4-6 недель, 5-6 этапов. Процесс корпоративный: HR, техническое интервью, кодинг и SQL, архитектурный кейс, поведенческое, финал.

1. HR-скрининг (30-45 минут)

Рекрутер уточняет: production-опыт DE (от 2 лет, желательно с enterprise SaaS или contact-center контекстом), знание стека, мотивацию идти в Naumen, ожидания по компенсации и формату (Москва, Екатеринбург, гибрид). Готовь питч на 90 секунд про самый зрелый production-pipeline.

2. Техническое интервью / SQL и архитектура (60-90 минут)

Базовая секция с senior DE из команды. Темы: SQL deep dive (оконки, оптимизация), модели данных (event-схемы для contact-center, ITSM), batch vs streaming, CDC, data quality. Специфический вопрос: «как ты бы построил pipeline для ASR-данных контакт-центра клиента-банка с compliance-требованиями (запись звонков, transcription, audit trail)».

Подготовка: SQL для DE, Data modeling, Kafka streaming.

3. Python + SQL live coding (60-90 минут)

Задачи прагматичные: 1-2 на SQL (оконки, JOIN, оптимизация), 1-2 на Python (pandas, простые ETL). Часто живой кейс: «дам тебе таблицу звонков и обращений, посчитай AHT и FCR по операторам». Готовиться: 30-50 SQL Medium-Hard задач + 20 простых на Python.

Подготовка: SQL для DE.

4. Архитектурный кейс (90 минут)

Самая характерная секция. Кейс: «спроектируй ASR-pipeline для контакт-центра банка с compliance ФСТЭК», «как ты бы построил retrieval-pipeline для Naumen Erudite (RAG из базы знаний клиента)», «как сделать ITSM-аналитику с SLA-tracking и эскалацией». Нужно: уточнить требования, описать архитектуру, выбрать стек, продумать data quality и compliance, заложить аудит. Сильный сигнал — учёт enterprise-специфики.

Подготовка: Airflow patterns, Monitoring и data quality.

5. Поведенческое + culture fit (45 минут)

С тимлидом или представителем направления. STAR-формат: конфликт с заказчиком (enterprise-клиент), факап в проде, длинный compliance-проект.

6. Финал с руководителем (30 минут)

Финальная встреча: грейд, оффер. Для compliance-ролей — СБ-проверка.

Особенности по командам

Contact-center DWH. Команда строит DWH для контакт-центров клиентов: звонки, обращения, метрики операторов. Стек — ClickHouse + Kafka + Airflow + dbt + интеграция с IVR и телефонией. Челлендж — реальное время для оперативных дашбордов цеха, исторические витрины для аналитики. Подойдёт DE с background в telco или contact-center.

Naumen Erudite (AI и ML-инфраструктура). Команда строит data infrastructure для AI Erudite: RAG-индексы на базе знаний клиентов, training data для fine-tuning, feature store для оператора. Стек — Spark + ClickHouse + кастомные feature-сервисы + интеграция с LLM-провайдерами и vector DB. Подойдёт DE с интересом к ML.

ITSM-аналитика (Naumen Service Desk). Команда занимается pipeline для ITSM: тикеты, SLA, эскалация, базы знаний. Стек — REST + ClickHouse + dbt. Подойдёт DE с background в ITSM или enterprise-аналитике.

ASR-pipeline. Команда работает с pipeline речевых данных: запись звонков, транскрипция (Whisper, NeMo), NLP-классификация. Стек — S3 для записей + Spark + специализированные ML-сервисы. Подойдёт DE с интересом к Speech AI.

Compliance и регуляторика. Команда работает с регуляторными требованиями: 152-ФЗ, ФСТЭК, ГОСТ Р 57580, банковские requirements. Стек — REST + специализированные compliance-инструменты + WORM-хранилища. Подойдёт DE с зрелым compliance-опытом.

Что Naumen ценит в DE

Enterprise-мышление. Naumen работает с крупными клиентами. Compliance, SLA, длинные циклы внедрения — норма.

Опыт работы с регуляторкой. Кандидат, который понимает 152-ФЗ, ФСТЭК, ГОСТ Р 57580 — сильный сигнал.

Документация — критическая часть. В Naumen документация для enterprise-внедрений — это часть продукта.

Weak vs strong на архитектурном кейсе. Слабый ответ: «возьмём Kafka + ClickHouse для ASR-pipeline банка». Сильный ответ: «ASR для банка — это compliance-критичный pipeline. Архитектура: запись звонков из IVR → S3 с шифрованием at-rest и in-transit (WORM-mode для immutability) → батч транскрипция через Whisper в Spark раз в час → результаты в ClickHouse для аналитики + хранение исходников в S3 7+ лет. Доступ только через scoped tokens с audit log каждого access (ФСТЭК-требование). PII-маскирование в транскриптах перед записью в ClickHouse. Reconciliation между количеством звонков в IVR и записями в ClickHouse еженедельно. Для AI Erudite — отдельный pipeline с consent-tracking».

Готовность к корпоративной среде. Naumen — корпоративный B2B.

Self-management. Циклы проектов длинные (3-6 месяцев на внедрение).

Готовься к собесу аналитика как в Duolingo

10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram

Открыть Карьерник в Telegram

Как готовиться: план

За 5-7 недель до планируемого собеса:

Неделя 1-2 — SQL deep dive и data modeling. Оконные функции, оптимизация. Модели данных для contact-center и ITSM. Прорешай 30 SQL Medium-Hard задач. Параллельно — на Карьернике обнови базу по SQL и Python: 1500+ задач, по 15-20 минут в день, чтобы за месяц закрыть пробелы.
Неделя 3 — Современный data stack и compliance. Kafka, Airflow, dbt, Spark, GDPR/152-ФЗ, ФСТЭК-обзорно.
Неделя 4 — Conversational AI и contact-center контекст. Прочитай блог Naumen, статьи Twilio, Genesys, Rasa, Dialogflow. Запомни понятия: IVR, NLU, intent, AHT, FCR, CSAT, RAG.
Неделя 5 — Архитектурные кейсы. Прорешай 5-6 кейсов: ASR-pipeline с compliance, retrieval для AI Erudite, ITSM-аналитика, contact-center DWH, biling enterprise. Структура — требования → источники → транспорт → процессинг → витрина → SLA → recovery. Airflow patterns.
Неделя 6-7 — Mocks и behavioral. Mock-интервью, 5-7 STAR-историй: конфликт с заказчиком (enterprise-клиент), факап в проде, длинный compliance-проект.

Частые ошибки

Не понимают enterprise-контекст. Кандидат рассказывает про быстрые продуктовые пилоты. В Naumen внедрение модели у клиента-банка — это 3-6 месяцев с compliance-checks.

Игнорируют compliance. В Naumen с банковскими клиентами и гос-облаком compliance — критическая часть.

Не разбираются в contact-center метриках. «Что такое AHT, FCR, CSAT?» — кандидат теряется.

Игнорируют PII и аудит. В compliance-pipeline нужно PII-маскирование и immutable audit log.

Не задают вопросы про SLA и латентность. На кейсе сразу — стек, а не «какие SLA, какие latency-требования, какой compliance». Это первый фильтр.

Связанные темы

FAQ

Удалёнка в Naumen для DE?

Гибрид с офисами в Москве и Екатеринбурге. Полная удалёнка возможна для отдельных позиций.

Зарплатные вилки 2026?

Middle DE: 230-360k. Senior: 360-560k. Lead — выше, особенно в AI Erudite и Speech-направлениях.

Нужен ли английский?

Базовый — для документации.

Сколько этапов?

5-6 этапов, 4-6 недель из-за corporate-процессов и compliance.

Реально ли пройти без enterprise-опыта?

На middle-позицию реально, если есть опыт с SaaS или contact-center. Для senior+ enterprise-команд — нужен опыт работы с банками/госорганами.

Какие книги и ресурсы помогут подготовиться?

«Designing Data-Intensive Applications» Мартина Клеппманна, статьи Twilio/Genesys про contact-center, документация Whisper и vector DB (Pinecone, Weaviate, Qdrant). По BPMN — Camunda guides. По SQL и техническому минимуму — задачник Карьерника, на котором можно прокачать оконные функции и SQL для contact-center-метрик (AHT, FCR, CSAT).

Что подчеркнуть на финале в Naumen?

Опыт работы с enterprise-клиентами (банки, госорганы), понимание длинных циклов внедрения, готовность к compliance-нагрузке. Истории про работу с ASR-pipeline, RAG-инфраструктурой для LLM, или regulated data — серьёзный плюс.

Чем работа в Naumen отличается от других SaaS-провайдеров?

Главное отличие — enterprise-фокус с длинными циклами внедрения (3-6 месяцев), серьёзный compliance (152-ФЗ, ФСТЭК), и специализация на contact-center и ITSM. Если хочешь работать с банками и крупными корпорациями, делать AI для разговорных продуктов — Naumen один из лучших вариантов в РФ. Также Naumen — одна из немногих компаний с production-grade ASR/conversational AI стеком.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера — формат и грейды отличаются по командам.