Собеседование на Data Scientist в Яндекс Go

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему Яндекс Go — особенный работодатель для DS

Яндекс Go — крупный mobility-сервис: такси, доставка, каршеринг. DS работает над ETA-прогнозом, surge pricing, маршрутизацией, demand prediction по гео-времени, fraud-детекцией, рекомендациями.

Особенность: модели работают в реальном времени, intervals в миллисекундах, latency и точность критичны для пользовательского опыта. Геоданные и time-series — основные источники данных. Подробнее — на странице карьеры Яндекса.

Информация в статье основана на публичных источниках и опыте кандидатов. Формат может отличаться по командам и грейдам. Уточняйте у рекрутера.

Этапы собеседования

1. Скрининг с рекрутером (30 минут)

Опыт, мотивация. Специфика:

  • Был ли опыт с time-series / geo / real-time ML
  • Знание классического ML
  • Готовность работать в high-frequency среде

2. SQL и Python (60 минут)

SQL — middle-senior. Python — pandas, numpy, sklearn.

3. ML-теория (60-90 минут)

  • Classical ML: gradient boosting (CatBoost — фаворит)
  • Time series: ARIMA, Prophet, ML на лагах
  • Регрессия с категориальными
  • Метрики regression: MAE, MAPE, WAPE
  • Дискретный выбор моделей: surge pricing — это classification или regression?

4. ML system design (60 минут)

«Спроектируй модель ETA», «surge pricing model», «demand prediction по часам и районам».

5. Поведенческое + финал

STAR + стратегический разговор.

Что Яндекс Go ценит в DS

  • Time-series навыки. Прогноз спроса, лаги, сезонность.
  • GIS / geo-данные. Координаты, расстояния, OSM.
  • Real-time mindset. Inference в миллисекундах.
  • Causal inference. Surge pricing — нужно различать causation и correlation.
  • Pragmatism. Простая модель в проде > SOTA в Jupyter.

Типичные задачи и кейсы

  • «Спроектируй модель ETA для такси»
  • «Surge pricing: модель, фичи, метрика»
  • «Demand prediction на следующие 30 минут по районам Москвы»
  • «Fraud-детекция платежей в реальном времени»
  • «Recommender water taxi / групповых поездок»
Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

  1. Classical ML. Gradient boosting глубоко.
  2. Time series. ARIMA, Prophet, ML на лагах.
  3. Geo-данные. OSM, координаты, distance-метрики.
  4. Causal inference. CUPED, uplift.
  5. Real-time ML. Inference latency, model serving.

Частые ошибки

  • Игнорировать time / geo сезонность. В mobility утро/вечер/выходные/праздники — всё разное.
  • MAPE на нулях. Спрос может быть 0 в час — лучше WAPE.
  • Сложная модель в реальном времени. Inference должен быть в миллисекундах.
  • Не учитывать spillover. Surge в одном районе влияет на соседние.

Связанные темы

FAQ

Сколько этапов в собеседовании на DS в Яндекс Go?

Обычно 5-6: рекрутер → SQL/Python → ML-теория → ML system design → поведенческое → финал. Срок 4-6 недель.

Нужен ли опыт в mobility?

Желателен. Релевантным считается food delivery, маркетплейс, real-time ML.

Какой уровень SQL?

Уверенный middle-senior.

Спрашивают ли алгоритмы?

В отдельных командах могут спросить graph (shortest path), DP.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.