Собеседование на Data Scientist в Яндекс Go
Содержание:
Почему Яндекс Go — особенный работодатель для DS
Яндекс Go — крупный mobility-сервис: такси, доставка, каршеринг. DS работает над ETA-прогнозом, surge pricing, маршрутизацией, demand prediction по гео-времени, fraud-детекцией, рекомендациями.
Особенность: модели работают в реальном времени, intervals в миллисекундах, latency и точность критичны для пользовательского опыта. Геоданные и time-series — основные источники данных. Подробнее — на странице карьеры Яндекса.
Информация в статье основана на публичных источниках и опыте кандидатов. Формат может отличаться по командам и грейдам. Уточняйте у рекрутера.
Этапы собеседования
1. Скрининг с рекрутером (30 минут)
Опыт, мотивация. Специфика:
- Был ли опыт с time-series / geo / real-time ML
- Знание классического ML
- Готовность работать в high-frequency среде
2. SQL и Python (60 минут)
SQL — middle-senior. Python — pandas, numpy, sklearn.
3. ML-теория (60-90 минут)
- Classical ML: gradient boosting (CatBoost — фаворит)
- Time series: ARIMA, Prophet, ML на лагах
- Регрессия с категориальными
- Метрики regression: MAE, MAPE, WAPE
- Дискретный выбор моделей: surge pricing — это classification или regression?
4. ML system design (60 минут)
«Спроектируй модель ETA», «surge pricing model», «demand prediction по часам и районам».
5. Поведенческое + финал
STAR + стратегический разговор.
Что Яндекс Go ценит в DS
- Time-series навыки. Прогноз спроса, лаги, сезонность.
- GIS / geo-данные. Координаты, расстояния, OSM.
- Real-time mindset. Inference в миллисекундах.
- Causal inference. Surge pricing — нужно различать causation и correlation.
- Pragmatism. Простая модель в проде > SOTA в Jupyter.
Типичные задачи и кейсы
- «Спроектируй модель ETA для такси»
- «Surge pricing: модель, фичи, метрика»
- «Demand prediction на следующие 30 минут по районам Москвы»
- «Fraud-детекция платежей в реальном времени»
- «Recommender water taxi / групповых поездок»
Как готовиться: план
- Classical ML. Gradient boosting глубоко.
- Time series. ARIMA, Prophet, ML на лагах.
- Geo-данные. OSM, координаты, distance-метрики.
- Causal inference. CUPED, uplift.
- Real-time ML. Inference latency, model serving.
Частые ошибки
- Игнорировать time / geo сезонность. В mobility утро/вечер/выходные/праздники — всё разное.
- MAPE на нулях. Спрос может быть 0 в час — лучше WAPE.
- Сложная модель в реальном времени. Inference должен быть в миллисекундах.
- Не учитывать spillover. Surge в одном районе влияет на соседние.
Связанные темы
- Собеседование на DS в Яндекс
- Собеседование на DS в Tinkoff
- Time series CV и features на собесе DS
- Causal inference: причинность vs корреляция
- Собеседование на PM в Я.Go
FAQ
Сколько этапов в собеседовании на DS в Яндекс Go?
Обычно 5-6: рекрутер → SQL/Python → ML-теория → ML system design → поведенческое → финал. Срок 4-6 недель.
Нужен ли опыт в mobility?
Желателен. Релевантным считается food delivery, маркетплейс, real-time ML.
Какой уровень SQL?
Уверенный middle-senior.
Спрашивают ли алгоритмы?
В отдельных командах могут спросить graph (shortest path), DP.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.