Собеседование на AI PM в InfoWatch
Содержание:
Почему InfoWatch — особенный работодатель для AI PM
InfoWatch — одна из старейших российских компаний в области информационной безопасности, основана в 2003 году. Главная экспертиза — защита от утечек данных (DLP, data loss prevention) и UEBA (анализ аномалий поведения пользователей). Клиенты — крупные корпорации, банки, госструктуры. Для AI PM это значит работу с очень специфическим продуктовым landscape: B2B-клиенты с сотнями гигабайт корпоративных документов, длинный sale-цикл и жёсткие SLA по false positive.
AI PM в InfoWatch отвечает за фичи на стыке security и NLP/CV: классификация документов и определение конфиденциальности (DLP NLP), OCR и обработка отсканированных PDF, UEBA-модели для аномалий в поведении сотрудников, anti-data-leak detection по контенту email и мессенджеров, LLM-копилоты для security-офицеров. Главный челлендж — баланс между recall (поймать утечку) и precision (не превращать жизнь сотрудников клиента в ад из ложных алертов).
Стек: классические ML-модели (XGBoost, CatBoost) для скоринга и UEBA, NLP-стек (BERT-семейство для классификации, fine-tuned под русский), OCR (Tesseract, кастомные модели для рукописного текста), LLM (open-source модели для on-premise развёртывания у клиентов), ClickHouse / Elasticsearch для аналитики событий.
Актуальные вакансии — на hh.ru и сайте InfoWatch.
Информация основана на публичных источниках и опыте кандидатов. Команды InfoWatch используют разные процессы — уточняйте у рекрутера.
Этапы собеседования
Цикл — 4-5 этапов, 2-3 недели. Параллельно — проверка СБ.
1. HR-скрининг (30-45 минут)
Рекрутер проверяет AI-фокус, базовое ML, опыт в DLP, NLP или cybersecurity. Любой experience в data classification или security-tooling — большой плюс. Готовь питч на 90 секунд: какие AI-фичи запускал в B2B, какие метрики двигал, насколько знаешь enterprise DLP-landscape.
2. AI / ML grounding (45-60 минут)
С ведущим PM или ML-лидом. Темы: метрики классификации в class-imbalance (precision на head-документах с PII, recall на tail-аномалиях), NLP для русского языка (особенности fine-tuning BERT на корпоративных текстах), OCR-качество на сканах, adversarial ML (инсайдер пытается обойти классификатор). На LLM-блоке — копилоты для security-офицеров.
Подготовка: LLM-фичи, ML для PM.
3. Product кейс с AI-фичей (90 минут)
Дают кейс «спроектируй DLP-классификатор документов». Жди вопросов про аудиторию (банки vs промышленность vs гос — у каждого своя классификация), JTBD (security-офицер хочет видеть только реальные риски), UX (где встраивается классификатор — на endpoint vs на gateway), риски (false positive блокирует легитимную работу; false negative — утечка), метрики (precision/recall, time to alert, alert-фатига аналитиков), MVP (с какой категории документов и с какого пилотного клиента стартуем). Сильные кандидаты сразу разводят «технический recall модели» и «оперативный эффект для аналитика SOC».
Подготовка: Prompt engineering, RAG и context.
4. Metrics / experimentation (45 минут)
Эксперименты в DLP: rare-event и big stakes. Спросят, как делать shadow-mode на новой классификации, как использовать red-team scenarios. Готовь evaluation framework: gold set документов от клиента, online precision/recall.
Подготовка: AI-метрики и evaluation.
5. Поведенческое (45 минут)
STAR с тимлидом. Истории про конфликт с security-командой клиента, факап с false positive, спор о scope продукта. Клиенты InfoWatch — security-офицеры крупных корпораций, они требовательны.
Особенности по командам
DLP NLP. Классификация документов: конфиденциально, PII, гос-тайна, коммерческая тайна. Тесно работает с security-офицерами клиентов. Подойдёт PM с NLP-бэкграундом и security-интересом.
OCR. Обработка отсканированных PDF, рукописных документов, скриншотов. Стек на пересечении CV и NLP. Подойдёт PM с CV/document-AI background.
UEBA AI. Аномалии поведения пользователей: необычное копирование файлов, аномальные запросы в БД, неожиданные удалённые подключения. Подойдёт PM с insider-threat или behavioural analytics опытом.
ARMA AI. Industrial security: защита промышленных систем (АСУ ТП) с применением AI. Подойдёт PM с интересом к OT-security.
Threat intelligence AI. Анализ внешних индикаторов угроз, корреляция с внутренними событиями клиента. Подойдёт PM с TI background.
Что InfoWatch ценит в AI PM
AI понимание. Слабый: «обучим BERT». Сильный: «BERT для классификации с fine-tune на клиентских данных под NDA; LLM для копилотов только on-premise — данные клиента не уходят в облако».
DLP / NLP context — большой плюс. Знание базы: типы конфиденциальной информации, GOST-тайны, режимы доступа, типичные сценарии утечек. Слабый: «детектируем». Сильный: «инсайдер ищет обходные каналы — отправка через личный мессенджер, фото экрана; продукт должен видеть оба сценария».
Adversarial ML. Понимание, что инсайдер адаптируется: переименовывает файлы, шифрует, делит на куски. Слабый: «модель доучится». Сильный: «учитываем shape-based детекцию, не только content-based; periodic red-team».
Business metrics. Не «precision/recall», а «снижение инцидентов утечек на 40%, alerts processed per analyst per shift +60%, retention клиентов B2B».
Cross-team. Security-команда клиента, ML-команда, presales, customer success. Проверяется на behavioral.
Как готовиться: план
За 4-6 недель до планируемого собеса:
- Неделя 1 — ML базовые + security primer. Метрики, class imbalance, базовые алгоритмы. Параллельно — основы insider threat и DLP. ML для PM.
- Неделя 2 — LLM + NLP глубже. Архитектура BERT/Transformer, fine-tuning, LLM для on-premise. Параллельно — прорешай вопросы по Python, ML и SQL в Карьернике: 1500+ задач с разбивкой по темам, по 10-15 минут в день закрывают пробелы перед собесом. LLM-фичи.
- Неделя 3 — Prompt + RAG. Enterprise RAG с правами доступа. Prompt engineering, RAG.
- Неделя 4 — Cost / latency. On-premise GPU TCO, latency на gateway-инспекции. AI cost и latency.
- Неделя 5 — Mocks + behavioral. Mock-кейс DLP с другом из cybersec.
- Неделя 6 — Polish. Перечитай отчёты InfoWatch об утечках, новости индустрии DLP.
Частые ошибки
«Добавим chatbot» без бизнес-кейса. Слабо: «AI-бот для security-офицеров». Сильно: «у аналитика SOC 200 алертов в смену, 60% false positive; LLM-помощник снимает 40% шума, аналитик переключается на T2-T3 задачи».
Игнор hallucinations / false positives. В DLP halluc = классификатор пропустил утечку или ложно заблокировал письмо CEO с реальным контрактом. Слабый: «обучим». Сильный: «для критичных категорий — human review; для типовых — auto-action с rollback».
Без DLP / NLP domain. Кандидат не знает, что такое PII, гос-тайна, коммерческая тайна — это видно сразу. Изучи: типы данных, режимы конфиденциальности.
Без adversarial ML. Слабый: «обучим». Сильный: «инсайдер обходит — переименование, шифрование, медленный exfil; периодический red-team с симуляцией».
AI metrics only. Слабо: F1. Сильно: «снижение инцидентов утечек на 35%, NPS клиентов B2B +12, retention 95%».
Связанные темы
- Собеседование на AI PM
- LLM-фичи в продукте
- Prompt engineering
- RAG и context
- AI-метрики и evaluation
- AI cost и latency
FAQ
Удалёнка в InfoWatch для AI PM?
Гибрид распространён, полная удалёнка обсуждаема. Часть встреч в офисе клиента.
Зарплатные вилки 2026?
Middle AI PM: 340-480k. Senior: 480-700k.
Английский нужен?
Базовый — желательно для чтения research-материалов. Большинство клиентов — российские.
Сколько этапов?
4-5 этапов, 2-3 недели. Дополнительно — проверка СБ.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера — команды и грейды могут менять процесс.