13 мая 2026 г.·4 мин чтения

Собеседование на Data Scientist в Яндекс Go

Проверь себя · 1/3разбор после ответа

При фиксированном размере выборки n стандартная ошибка среднего связана с разбросом данных как SE = σ/√n. Если стандартное отклонение метрики σ выросло в 2 раза, что произойдёт с SE?

Содержание:

Почему Яндекс Go — особенный работодатель для DS
Этапы собеседования
Что Яндекс Go ценит в DS
Типичные задачи и кейсы
Как готовиться: план
Частые ошибки
Связанные темы
FAQ

Почему Яндекс Go — особенный работодатель для DS

Яндекс Go — крупный mobility-сервис: такси, доставка, каршеринг. DS работает над ETA-прогнозом, surge pricing, маршрутизацией, demand prediction по гео-времени, fraud-детекцией, рекомендациями.

Особенность: модели работают в реальном времени, intervals в миллисекундах, latency и точность критичны для пользовательского опыта. Геоданные и time-series — основные источники данных. Подробнее — на странице карьеры Яндекса.

Информация в статье основана на публичных источниках и опыте кандидатов. Формат может отличаться по командам и грейдам. Уточняйте у рекрутера.

Этапы собеседования

1. Скрининг с рекрутером (30 минут)

Опыт, мотивация. Специфика:

Был ли опыт с time-series / geo / real-time ML
Знание классического ML
Готовность работать в high-frequency среде

2. SQL и Python (60 минут)

SQL — middle-senior. Python — pandas, numpy, sklearn.

3. ML-теория (60-90 минут)

Classical ML: gradient boosting (CatBoost — фаворит)
Time series: ARIMA, Prophet, ML на лагах
Регрессия с категориальными
Метрики regression: MAE, MAPE, WAPE
Дискретный выбор моделей: surge pricing — это classification или regression?

4. ML system design (60 минут)

«Спроектируй модель ETA», «surge pricing model», «demand prediction по часам и районам».

5. Поведенческое + финал

STAR + стратегический разговор.

Что Яндекс Go ценит в DS

Time-series навыки. Прогноз спроса, лаги, сезонность.
GIS / geo-данные. Координаты, расстояния, OSM.
Real-time mindset. Inference в миллисекундах.
Causal inference. Surge pricing — нужно различать causation и correlation.
Pragmatism. Простая модель в проде > SOTA в Jupyter.

Типичные задачи и кейсы

«Спроектируй модель ETA для такси»
«Surge pricing: модель, фичи, метрика»
«Demand prediction на следующие 30 минут по районам Москвы»
«Fraud-детекция платежей в реальном времени»
«Recommender water taxi / групповых поездок»

Готовься к собесу аналитика как в Duolingo

10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram

Открыть Карьерник в Telegram

Как готовиться: план

Classical ML. Gradient boosting глубоко.
Time series. ARIMA, Prophet, ML на лагах.
Geo-данные. OSM, координаты, distance-метрики.
Causal inference. CUPED, uplift.
Real-time ML. Inference latency, model serving.

Частые ошибки

Игнорировать time / geo сезонность. В mobility утро/вечер/выходные/праздники — всё разное.
MAPE на нулях. Спрос может быть 0 в час — лучше WAPE.
Сложная модель в реальном времени. Inference должен быть в миллисекундах.
Не учитывать spillover. Surge в одном районе влияет на соседние.

Связанные темы

FAQ

Сколько этапов в собеседовании на DS в Яндекс Go?

Обычно 5-6: рекрутер → SQL/Python → ML-теория → ML system design → поведенческое → финал. Срок 4-6 недель.

Нужен ли опыт в mobility?

Желателен. Релевантным считается food delivery, маркетплейс, real-time ML.

Какой уровень SQL?

Уверенный middle-senior.

Спрашивают ли алгоритмы?

В отдельных командах могут спросить graph (shortest path), DP.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.