Собеседование на AI PM в InfoWatch

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему InfoWatch — особенный работодатель для AI PM

InfoWatch — одна из старейших российских компаний в области информационной безопасности, основана в 2003 году. Главная экспертиза — защита от утечек данных (DLP, data loss prevention) и UEBA (анализ аномалий поведения пользователей). Клиенты — крупные корпорации, банки, госструктуры. Для AI PM это значит работу с очень специфическим продуктовым landscape: B2B-клиенты с сотнями гигабайт корпоративных документов, длинный sale-цикл и жёсткие SLA по false positive.

AI PM в InfoWatch отвечает за фичи на стыке security и NLP/CV: классификация документов и определение конфиденциальности (DLP NLP), OCR и обработка отсканированных PDF, UEBA-модели для аномалий в поведении сотрудников, anti-data-leak detection по контенту email и мессенджеров, LLM-копилоты для security-офицеров. Главный челлендж — баланс между recall (поймать утечку) и precision (не превращать жизнь сотрудников клиента в ад из ложных алертов).

Стек: классические ML-модели (XGBoost, CatBoost) для скоринга и UEBA, NLP-стек (BERT-семейство для классификации, fine-tuned под русский), OCR (Tesseract, кастомные модели для рукописного текста), LLM (open-source модели для on-premise развёртывания у клиентов), ClickHouse / Elasticsearch для аналитики событий.

Актуальные вакансии — на hh.ru и сайте InfoWatch.

Информация основана на публичных источниках и опыте кандидатов. Команды InfoWatch используют разные процессы — уточняйте у рекрутера.

Этапы собеседования

Цикл — 4-5 этапов, 2-3 недели. Параллельно — проверка СБ.

1. HR-скрининг (30-45 минут)

Рекрутер проверяет AI-фокус, базовое ML, опыт в DLP, NLP или cybersecurity. Любой experience в data classification или security-tooling — большой плюс. Готовь питч на 90 секунд: какие AI-фичи запускал в B2B, какие метрики двигал, насколько знаешь enterprise DLP-landscape.

2. AI / ML grounding (45-60 минут)

С ведущим PM или ML-лидом. Темы: метрики классификации в class-imbalance (precision на head-документах с PII, recall на tail-аномалиях), NLP для русского языка (особенности fine-tuning BERT на корпоративных текстах), OCR-качество на сканах, adversarial ML (инсайдер пытается обойти классификатор). На LLM-блоке — копилоты для security-офицеров.

Подготовка: LLM-фичи, ML для PM.

3. Product кейс с AI-фичей (90 минут)

Дают кейс «спроектируй DLP-классификатор документов». Жди вопросов про аудиторию (банки vs промышленность vs гос — у каждого своя классификация), JTBD (security-офицер хочет видеть только реальные риски), UX (где встраивается классификатор — на endpoint vs на gateway), риски (false positive блокирует легитимную работу; false negative — утечка), метрики (precision/recall, time to alert, alert-фатига аналитиков), MVP (с какой категории документов и с какого пилотного клиента стартуем). Сильные кандидаты сразу разводят «технический recall модели» и «оперативный эффект для аналитика SOC».

Подготовка: Prompt engineering, RAG и context.

4. Metrics / experimentation (45 минут)

Эксперименты в DLP: rare-event и big stakes. Спросят, как делать shadow-mode на новой классификации, как использовать red-team scenarios. Готовь evaluation framework: gold set документов от клиента, online precision/recall.

Подготовка: AI-метрики и evaluation.

5. Поведенческое (45 минут)

STAR с тимлидом. Истории про конфликт с security-командой клиента, факап с false positive, спор о scope продукта. Клиенты InfoWatch — security-офицеры крупных корпораций, они требовательны.

Особенности по командам

DLP NLP. Классификация документов: конфиденциально, PII, гос-тайна, коммерческая тайна. Тесно работает с security-офицерами клиентов. Подойдёт PM с NLP-бэкграундом и security-интересом.

OCR. Обработка отсканированных PDF, рукописных документов, скриншотов. Стек на пересечении CV и NLP. Подойдёт PM с CV/document-AI background.

UEBA AI. Аномалии поведения пользователей: необычное копирование файлов, аномальные запросы в БД, неожиданные удалённые подключения. Подойдёт PM с insider-threat или behavioural analytics опытом.

ARMA AI. Industrial security: защита промышленных систем (АСУ ТП) с применением AI. Подойдёт PM с интересом к OT-security.

Threat intelligence AI. Анализ внешних индикаторов угроз, корреляция с внутренними событиями клиента. Подойдёт PM с TI background.

Что InfoWatch ценит в AI PM

AI понимание. Слабый: «обучим BERT». Сильный: «BERT для классификации с fine-tune на клиентских данных под NDA; LLM для копилотов только on-premise — данные клиента не уходят в облако».

DLP / NLP context — большой плюс. Знание базы: типы конфиденциальной информации, GOST-тайны, режимы доступа, типичные сценарии утечек. Слабый: «детектируем». Сильный: «инсайдер ищет обходные каналы — отправка через личный мессенджер, фото экрана; продукт должен видеть оба сценария».

Adversarial ML. Понимание, что инсайдер адаптируется: переименовывает файлы, шифрует, делит на куски. Слабый: «модель доучится». Сильный: «учитываем shape-based детекцию, не только content-based; periodic red-team».

Business metrics. Не «precision/recall», а «снижение инцидентов утечек на 40%, alerts processed per analyst per shift +60%, retention клиентов B2B».

Cross-team. Security-команда клиента, ML-команда, presales, customer success. Проверяется на behavioral.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

За 4-6 недель до планируемого собеса:

  1. Неделя 1 — ML базовые + security primer. Метрики, class imbalance, базовые алгоритмы. Параллельно — основы insider threat и DLP. ML для PM.
  2. Неделя 2 — LLM + NLP глубже. Архитектура BERT/Transformer, fine-tuning, LLM для on-premise. Параллельно — прорешай вопросы по Python, ML и SQL в Карьернике: 1500+ задач с разбивкой по темам, по 10-15 минут в день закрывают пробелы перед собесом. LLM-фичи.
  3. Неделя 3 — Prompt + RAG. Enterprise RAG с правами доступа. Prompt engineering, RAG.
  4. Неделя 4 — Cost / latency. On-premise GPU TCO, latency на gateway-инспекции. AI cost и latency.
  5. Неделя 5 — Mocks + behavioral. Mock-кейс DLP с другом из cybersec.
  6. Неделя 6 — Polish. Перечитай отчёты InfoWatch об утечках, новости индустрии DLP.

Частые ошибки

«Добавим chatbot» без бизнес-кейса. Слабо: «AI-бот для security-офицеров». Сильно: «у аналитика SOC 200 алертов в смену, 60% false positive; LLM-помощник снимает 40% шума, аналитик переключается на T2-T3 задачи».

Игнор hallucinations / false positives. В DLP halluc = классификатор пропустил утечку или ложно заблокировал письмо CEO с реальным контрактом. Слабый: «обучим». Сильный: «для критичных категорий — human review; для типовых — auto-action с rollback».

Без DLP / NLP domain. Кандидат не знает, что такое PII, гос-тайна, коммерческая тайна — это видно сразу. Изучи: типы данных, режимы конфиденциальности.

Без adversarial ML. Слабый: «обучим». Сильный: «инсайдер обходит — переименование, шифрование, медленный exfil; периодический red-team с симуляцией».

AI metrics only. Слабо: F1. Сильно: «снижение инцидентов утечек на 35%, NPS клиентов B2B +12, retention 95%».

Связанные темы

FAQ

Удалёнка в InfoWatch для AI PM?

Гибрид распространён, полная удалёнка обсуждаема. Часть встреч в офисе клиента.

Зарплатные вилки 2026?

Middle AI PM: 340-480k. Senior: 480-700k.

Английский нужен?

Базовый — желательно для чтения research-материалов. Большинство клиентов — российские.

Сколько этапов?

4-5 этапов, 2-3 недели. Дополнительно — проверка СБ.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера — команды и грейды могут менять процесс.