Собеседование на Data Scientist в GeekBrains
Содержание:
Почему GeekBrains — особенный работодатель для DS
GeekBrains — один из крупнейших российских EdTech-сервисов, исторически входивший в Mail.ru group (теперь VK). Фокус — IT-образование: программирование, аналитика данных, дизайн, тестирование, продакт-менеджмент. Длинные образовательные программы (от 6 до 12 месяцев), формат online-обучения с менторами, гибридная модель монетизации (рассрочка, оплата по этапам). Для Data Scientist это работа с продуктом, где главный конкурент — Нетология / Skillbox / Яндекс Практикум, и где каждое продуктовое решение принимается на основе экспериментов: оптимизация конверсии лидов, retention в программе, recommendation курсов, прогноз outcomes выпускников.
ML-домены: LTV-прогноз и lead-scoring (вероятность покупки на каждом шаге воронки), прогноз ROI маркетинговых каналов, optimization цены курсов и pricing-стратегий, прогноз retention в программе обучения (предсказание выпадения студента), персонализация подбора программы под бэкграунд лида, recommendation смежных курсов / upsell, NLP на отзывах и работах студентов, прогноз career outcomes (поможет ли курс найти работу — для маркетинга и пиар-кейсов). Стек: Python, CatBoost / XGBoost, scikit-learn, ClickHouse, PostgreSQL, Airflow, Jupyter, MLflow, внутренний A/B-фреймворк (часть инфраструктуры может переиспользовать VK-стек).
Актуальные вакансии — на hh.ru и сайте GeekBrains / VK.
Информация основана на публичных источниках и опыте кандидатов. Команды GeekBrains используют разные процессы — уточняйте у рекрутера.
Этапы собеседования
Цикл 3–5 недель и включает 4–6 этапов. Процесс ближе к корпоративному (VK-структура), чем у независимых EdTech. Технические секции структурированы, есть отдельная секция по продукту.
1. HR-скрининг (30–45 минут)
Рекрутер проверяет: production-опыт DS / аналитики (1+ год), причины смены работы, ожидания, интерес к EdTech. Опыт в подписочных или EdTech-продуктах — плюс. Питч 60–90 секунд: имя, основные проекты, бизнес-эффект.
2. Тестовое задание (3–5 дней)
Часто даётся: датасет с лидами, конверсиями и cohort-данными студентов; нужно построить модель LTV или конверсии лидов. Сильные кандидаты обсуждают marketing-attribution, делают честную time-based валидацию и интерпретируют бизнес-смысл результатов.
3. ML / DS-теория (60–90 минут)
С senior DS из команды. Темы: классика (бустинги, регуляризация, метрики, calibration), uplift-моделирование для маркетинга, survival-анализ для retention в программе, time-series для прогноза набора на следующий поток, propensity-score matching для оценки эффекта вмешательств (например, ментор-сессии). Готовься объяснять выбор между классификацией и регрессией под конкретные бизнес-задачи.
Подготовка: Классическая ML на собесе, ML-теория.
4. Python + SQL live-coding (60–90 минут)
Live: 1–2 алгоритмических задачи (LeetCode Medium-Easy), 1–2 на pandas / SQL по учебным данным. SQL обычно классический: оконные функции, retention внутри программы (есть ли студент в учебных событиях через N дней после старта), GROUP BY с фильтрами, JOIN на иерархических данных (программа → модуль → урок → задание).
Подготовка: Live-coding, SQL-собес.
5. A/B и продуктовая секция (60–90 минут)
Спрашивают: дизайн эксперимента, sample size, MDE, ratio-метрики, peeking, как анализировать эффект на коротком тесте при длинном LTV-горизонте. Продуктовая часть: «как ты бы измерил эффект изменения цены», «как сегментировать платящих по треку», «как построить retention-кампанию». Готовь конкретные кейсы с цифрами.
Подготовка: A/B и causal inference.
6. Поведенческое + культурный fit (30–45 минут)
С тимлидом и/или продактом. STAR-формат: конфликт, факап, инициатива. GeekBrains ценит DS, которые умеют объяснять модели маркетологам и методистам — это часто проверяется в формате «объясни своими словами без формул».
Особенности по командам
Marketing & Lead Scoring. Главная команда: оптимизация рекламных кампаний, прогноз ROI каналов, attribution, скоринг лидов на каждом шаге воронки (показ → клик → лендинг → консультация → оплата), персонализация рассылок. Самая большая по численности, плотные A/B-итерации. Подойдёт DS с background в performance-маркетинге, banking-scoring или e-commerce.
Retention & Student Success. Прогноз выпадения студента из программы, оптимизация триггеров поддержки (когда ментор должен позвонить, когда отправить push), реактивация спящих. Тесная связка с методистами и кураторами. Подойдёт DS с интересом к образованию и поведенческой аналитике.
Course Recommendation & Upsell. Меньше команда: рекомендации курсов после покупки, upsell в смежные программы, персонализация контента в личном кабинете. CF, content-based подходы, contextual bandits для рассылок.
Pricing & Cohort Economics. Меньше команда, но влиятельная: оптимизация цены и pricing-стратегий, unit-economics новых программ, прогноз ROI на инвестиции в маркетинг. Тесная связка с финансами и продактами.
Career Outcomes Analytics. Уникальная для EdTech команда: трекинг трудоустройства выпускников, прогноз вероятности успешного карьерного перехода для лидов с разным бэкграундом, бенчмарки по программам. Тесная связка с маркетингом (кейсы) и партнёрской сетью работодателей.
VK Ecosystem Integration. Уникальная для GeekBrains возможность — использование сигналов из экосистемы VK для прогноза заинтересованности и оптимизации UA. Тесная связка с data governance и compliance VK. Подойдёт senior DS с пониманием большой экосистемы и требований к данным.
Forecasting & Capacity Planning. Меньше команда: прогноз набора на следующие потоки программ, сезонный анализ спроса, прогноз нагрузки на менторов и кураторов. Mix time-series и операционной аналитики.
Что GeekBrains ценит в DS
Бизнес-фокус. Weak: «обучил CatBoost, ROC-AUC 0.79». Strong: «обучил lead-scoring CatBoost на 300k лидов, time-based валидация, в A/B на 25% за 14 дней +18% конверсии в оплату и +X% к ROI; бизнес-эффект — около +Y млн руб. в месяц». Цифры обязательны.
Понимание EdTech-специфики. Длинный цикл (от покупки до выпуска — 6–12 мес), низкая частотность покупок, важность career outcomes для маркетинга. Кандидат, мыслящий категориями e-commerce, выглядит сыро.
Умение объяснять модели non-tech. Маркетинг, методисты, продакты в GeekBrains — не все технические. Кандидат, умеющий говорить о модели в 2–3 фразах без формул, выделяется.
Кросс-функциональность. DS работает с маркетингом, продуктом, методистами, поддержкой. Готовность брать задачи разной природы — критично.
Опыт A/B. Эксперименты — основа работы. Конкретные кейсы с цифрами и честный разбор null-результатов — обязательно.
Как готовиться: план
Минимум 5–7 недель. Неделя 1–2: ML-теория (классика, бустинги, метрики, calibration, uplift). Неделя 3: LeetCode + pandas (40 задач). Неделя 4: SQL — оконки, retention, ratio. Неделя 5: A/B + marketing-attribution (last-click, MMM, multi-touch). Неделя 6: продуктовая часть — изучи продукт GeekBrains (зайди на бесплатный вебинар, посмотри 1–2 публичных кейса), подготовь STAR-истории. Неделя 7: mock-интервью и работа со слабыми местами.
Для тренировки реальных вопросов с DS-собесов — открывай Карьерник: 1500+ задач по SQL, Python, A/B, статистике, продуктовой аналитике и ML по темам и сложности.
Частые ошибки
Первая — игнорирование long-horizon метрик. EdTech живёт на LTV-12-месяцев и career outcomes. Если ты фокусируешься только на конверсии в оплату — теряешь половину картинки.
Вторая — слабая marketing-аналитика. Performance-каналы — это половина задач, и кандидат, не различающий last-click vs data-driven attribution и не понимающий MMM, выглядит сыро.
Третья — нет цифр в кейсах. На вопрос про самый успешный проект сильный ответ — с конкретными цифрами и описанием A/B. Без цифр — это «не работало в проде».
Четвёртая — слабое объяснение модели. На собесе тебя могут попросить «объясни так, чтобы понял маркетолог». Если ты не можешь — это серьёзный минус.
Пятая — попытка перенести подходы из e-commerce без учёта EdTech-специфики (длинный цикл, высокий чек, низкая частота). Сильный кандидат сразу обсуждает эти различия.
Связанные темы
- Собеседование на Data Scientist в Нетологии
- Собеседование на Data Scientist в Skillbox
- Собеседование на Data Scientist в Skyeng
- Собеседование на Data Scientist — гайд
FAQ
Сколько этапов в собесе DS в GeekBrains?
4–6 этапов: HR-скрининг, тестовое задание, ML / DS-теория, Python + SQL live-coding, A/B и продуктовая секция, поведенческое. Цикл — 3–5 недель.
Нужен ли опыт в EdTech?
Желателен, но не обязателен. Сильный опыт в маркетинг-аналитике, banking-scoring или подписочной аналитике подходит. Готовность погрузиться в EdTech-специфику — must.
Чем DS в GeekBrains отличается от DS в Нетологии?
По задачам и стеку — близко. Главное отличие: GeekBrains в составе VK-экосистемы, что даёт дополнительные данные и интеграцию с VK-маркетингом; процессы ближе к корпоративным. Нетология — независимый бренд (Татьянинский), процессы менее формализованы.
Какой английский нужен?
B1–B2 минимум. Внутренние коммуникации в основном на русском.
Сколько платят DS в GeekBrains?
Зависит от грейда. Для middle DS — на уровне средних tech-компаний РФ (близко к Нетологии / Skillbox), для senior — выше. Marketing-DS обычно платят больше из-за объёма бюджетов.
Как глубоко проверяют ML system design?
Глубоко для middle и особенно для senior. Готовь 4–5 типовых кейсов (lead-scoring, LTV, retention, recsys, career outcomes) с проработанным flow: метрика → данные → baseline → итерации → A/B → мониторинг.
Берут ли DS без опыта в EdTech?
Берут, если сильный фундамент по ML и опыт A/B-экспериментов в маркетинг-аналитике или подписочных продуктах. Готовность погрузиться в EdTech-специфику до собеса — must.