Собеседование на Data Scientist в Aviasales
Содержание:
Почему Aviasales — особенный работодатель для DS
Aviasales — крупный российский метапоиск авиабилетов. DS работает над ранжированием билетов в выдаче (sort by best deal), прогнозом цен (когда дешевле купить), recsys отелей и страховок, классификацией предложений (валидность, fraud), NLP для анализа отзывов.
Особенность: travel — это эпизодический бизнес. Пользователь редко возвращается, эксперименты длятся неделями, retention считается по годам. Подробнее — на странице карьеры Aviasales.
Информация в статье основана на публичных источниках и опыте кандидатов. Формат может отличаться по командам и грейдам. Уточняйте у рекрутера.
Этапы собеседования
1. Скрининг с рекрутером (30 минут)
Опыт, мотивация. Специфика:
- Был ли опыт с travel / маркетплейсом
- Знание классического ML + ranking
- Готовность к долгим экспериментам
2. SQL и Python (60 минут)
SQL — middle-senior. Python — pandas, sklearn.
3. ML-теория (60-90 минут)
- Classical ML: gradient boosting
- Ranking: learning-to-rank, LambdaMART, метрики (NDCG, MRR)
- Time series для прогноза цен
- Cold start, retention в travel
4. ML system design (60 минут)
«Ранжирование билетов в выдаче», «прогноз цены через 7 дней», «recsys отелей».
5. Поведенческое + финал
STAR + стратегический разговор.
Что Aviasales ценит в DS
- Ranking-mindset. Learning-to-rank, NDCG, MRR.
- Time series. Цены меняются динамически.
- Recsys. Travel-specific recsys (отели, страховки).
- A/B на длинных циклах. Holdout.
- Pragmatism. Простая модель в проде > SOTA в Jupyter.
Типичные задачи и кейсы
- «Ранжирование билетов: фичи, модель, метрики»
- «Прогноз цены через 7 дней: time series или ML на лагах»
- «Recsys отелей при покупке билета: cold start»
- «Классификация спам / валидных предложений от OTA»
- «Эффект show "Cheapest deal" badge: эксперимент»
Как готовиться: план
- Classical ML. Gradient boosting.
- Ranking. Learning-to-rank, NDCG, MRR.
- Time series. ARIMA, Prophet, ML на лагах.
- A/B. Holdout vs A/B, CUPED.
- Recsys. Cold start, content-based.
Частые ошибки
- Игнорировать сезонность. Travel — сильно сезонный.
- AUC ≠ ranking. Учи NDCG, MRR.
- A/B на короткие сроки. В travel эффект видно через недели.
- Слабая SQL. Уверенный middle-senior.
Связанные темы
- Собеседование на Data Scientist
- Ranking метрики (NDCG)
- Holdout vs A/B на практике
- Собеседование на PM в Aviasales
- Собеседование на DS в Я.Маркет
FAQ
Сколько этапов в собеседовании на DS в Aviasales?
Обычно 5-6: рекрутер → SQL/Python → ML-теория → ML system design → поведенческое → финал. Срок 4-5 недель.
Нужен ли travel-опыт?
Желателен. Релевантным считается e-com, маркетплейс с ранжированием.
Какой уровень SQL?
Уверенный middle-senior.
Спрашивают ли deep learning?
Базовое — для NLP отзывов. Глубокое — нет.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.