Собеседование на Data Scientist в Aviasales

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему Aviasales — особенный работодатель для DS

Aviasales — крупный российский метапоиск авиабилетов. DS работает над ранжированием билетов в выдаче (sort by best deal), прогнозом цен (когда дешевле купить), recsys отелей и страховок, классификацией предложений (валидность, fraud), NLP для анализа отзывов.

Особенность: travel — это эпизодический бизнес. Пользователь редко возвращается, эксперименты длятся неделями, retention считается по годам. Подробнее — на странице карьеры Aviasales.

Информация в статье основана на публичных источниках и опыте кандидатов. Формат может отличаться по командам и грейдам. Уточняйте у рекрутера.

Этапы собеседования

1. Скрининг с рекрутером (30 минут)

Опыт, мотивация. Специфика:

  • Был ли опыт с travel / маркетплейсом
  • Знание классического ML + ranking
  • Готовность к долгим экспериментам

2. SQL и Python (60 минут)

SQL — middle-senior. Python — pandas, sklearn.

3. ML-теория (60-90 минут)

  • Classical ML: gradient boosting
  • Ranking: learning-to-rank, LambdaMART, метрики (NDCG, MRR)
  • Time series для прогноза цен
  • Cold start, retention в travel

4. ML system design (60 минут)

«Ранжирование билетов в выдаче», «прогноз цены через 7 дней», «recsys отелей».

5. Поведенческое + финал

STAR + стратегический разговор.

Что Aviasales ценит в DS

  • Ranking-mindset. Learning-to-rank, NDCG, MRR.
  • Time series. Цены меняются динамически.
  • Recsys. Travel-specific recsys (отели, страховки).
  • A/B на длинных циклах. Holdout.
  • Pragmatism. Простая модель в проде > SOTA в Jupyter.

Типичные задачи и кейсы

  • «Ранжирование билетов: фичи, модель, метрики»
  • «Прогноз цены через 7 дней: time series или ML на лагах»
  • «Recsys отелей при покупке билета: cold start»
  • «Классификация спам / валидных предложений от OTA»
  • «Эффект show "Cheapest deal" badge: эксперимент»
Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

  1. Classical ML. Gradient boosting.
  2. Ranking. Learning-to-rank, NDCG, MRR.
  3. Time series. ARIMA, Prophet, ML на лагах.
  4. A/B. Holdout vs A/B, CUPED.
  5. Recsys. Cold start, content-based.

Частые ошибки

  • Игнорировать сезонность. Travel — сильно сезонный.
  • AUC ≠ ranking. Учи NDCG, MRR.
  • A/B на короткие сроки. В travel эффект видно через недели.
  • Слабая SQL. Уверенный middle-senior.

Связанные темы

FAQ

Сколько этапов в собеседовании на DS в Aviasales?

Обычно 5-6: рекрутер → SQL/Python → ML-теория → ML system design → поведенческое → финал. Срок 4-5 недель.

Нужен ли travel-опыт?

Желателен. Релевантным считается e-com, маркетплейс с ранжированием.

Какой уровень SQL?

Уверенный middle-senior.

Спрашивают ли deep learning?

Базовое — для NLP отзывов. Глубокое — нет.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.