Собеседование на Data Engineer в Циан

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему Циан — особенный работодатель для DE

Циан — крупнейший сервис недвижимости РФ. DE работает с разнородными данными: XML-фиды от агентств, парсинг текстов объявлений, гео-данные, фото-обработка, ML-фичи для AVM. Стэк: PostgreSQL, ElasticSearch, Spark, ClickHouse.

Особенность: PropTech требует разнородных pipelines (tabular + text + image + geo). Подробнее — на странице карьеры Циан.

Информация в статье основана на публичных источниках и опыте кандидатов. Формат может отличаться по командам и грейдам. Уточняйте у рекрутера.

Этапы собеседования

1. Скрининг (30 минут)

Опыт, мотивация.

2. SQL и Python (60 минут)

SQL — middle-senior. Python — pandas.

3. Big Data (60-90 минут)

Spark.

4. ElasticSearch / PostgreSQL (45-60 минут)

ElasticSearch для поиска, PostgreSQL с GIS-расширениями (PostGIS).

5. Архитектура (60 минут)

«Pipeline для XML-фидов агентств», «search-индекс объявлений», «гео-кластеризация».

6. Поведенческое + финал

STAR + культурный фит.

Что Циан ценит в DE

  • Spark.
  • ElasticSearch. Для search.
  • PostgreSQL + PostGIS. Для гео.
  • Heterogeneous data. XML, текст, фото, гео.
  • Pragmatism.

Типичные задачи и кейсы

  • «Pipeline для XML-фидов агентств: валидация, дедупликация»
  • «Search-индекс объявлений: ElasticSearch tuning»
  • «Гео-кластеризация районов»
  • «Backfill изменений в объявлениях»
  • «Image-pipeline для классификации фото»
Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

  1. Spark. RDD, DataFrame.
  2. ElasticSearch. Индексы, queries.
  3. PostgreSQL + PostGIS.
  4. Airflow.
  5. SQL. Middle-senior.

Частые ошибки

  • Игнорировать ElasticSearch. Search — основа Циан.
  • Слабая SQL.
  • Spark поверхностно.

Связанные темы

FAQ

Сколько этапов?

Обычно 5-6. Срок 4-6 недель.

Нужен ли PropTech-опыт?

Желателен.

Какие инструменты главные?

Spark + ElasticSearch + PostgreSQL + ClickHouse + Airflow.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.