Собеседование на Data Engineer в Aviasales

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему Aviasales — особенный работодатель для DE

Aviasales — крупный travel metasearch. DE работает с pipelines цен от десятков OTA, поисковыми событиями (миллионы запросов в день), обработкой XML-фидов от провайдеров, аналитикой A/B-экспериментов. Стэк: Spark, ClickHouse, Kafka, Airflow.

Особенность: travel data — heterogenous (разные форматы от OTA), цены меняются динамически. Подробнее — на странице карьеры Aviasales.

Информация в статье основана на публичных источниках и опыте кандидатов. Формат может отличаться по командам и грейдам. Уточняйте у рекрутера.

Этапы собеседования

1. Скрининг (30 минут)

Опыт, мотивация.

2. SQL и Python (60 минут)

SQL — middle-senior. Python — pandas.

3. Big Data + Spark (60-90 минут)

Spark на heterogeneous data.

4. ClickHouse (45-60 минут)

Engines, partitioning, MV.

5. Архитектура (60 минут)

«Pipeline для real-time prices», «обработка XML-фидов», «A/B-инфраструктура».

6. Поведенческое + финал

STAR + культурный фит.

Что Aviasales ценит в DE

  • Spark. Глубоко.
  • ClickHouse. Для аналитики.
  • Heterogeneous data. XML, JSON, CSV.
  • Real-time mindset. Цены меняются.
  • A/B-инфраструктура.

Типичные задачи и кейсы

  • «Pipeline для real-time prices от OTA»
  • «Обработка XML-фидов: парсинг, валидация»
  • «ClickHouse для аналитики поисковых событий»
  • «A/B-инфраструктура: bucketing, метрики»
  • «Spark job на 1 TB поисковых событий»
Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

  1. Spark deep.
  2. ClickHouse. Engines, partitioning.
  3. Streaming. Kafka.
  4. A/B-инфраструктура. Bucketing.
  5. SQL. Middle-senior.

Частые ошибки

  • Слабая SQL.
  • ClickHouse поверхностно.
  • Игнорировать heterogeneous data.

Связанные темы

FAQ

Сколько этапов?

Обычно 5-6. Срок 4-6 недель.

Нужен ли travel-опыт?

Желателен.

Какие инструменты главные?

Spark + ClickHouse + Kafka + Airflow.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.