Собеседование на Data Engineer в Skyeng

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Почему Skyeng — особенный работодатель для DE

Skyeng — один из крупнейших EdTech-сервисов РФ. DE работает над pipelines пользовательских событий (уроки, тесты, домашние задания), биллингом подписок, ML-фичами для рекомендаций уроков и преподавателей.

Особенность: EdTech продукт имеет специфику — длинные циклы (студенты учатся месяцами), пиковая нагрузка (вечера, выходные), много событий (interaction-based learning). Стэк: Spark / Hadoop для batch, ClickHouse для аналитики, dbt для трансформаций, Airflow для оркестрации. Подробнее — на странице карьеры Skyeng.

Информация в статье основана на публичных источниках и опыте кандидатов. Формат может отличаться по командам и грейдам. Уточняйте у рекрутера.

Этапы собеседования

1. Скрининг с рекрутером (30 минут)

Опыт, мотивация. Специфика:

  • Был ли опыт с event-данными
  • Знание SQL deep + Python
  • Готовность к продуктовому подходу

2. SQL и Python (60 минут)

SQL — middle-senior. Python — pandas, pyspark.

3. Big Data + Spark (60-90 минут)

Spark на event-данных.

4. ClickHouse + dbt (45-60 минут)

ClickHouse для real-time витрин. dbt для трансформаций, тестов, snapshots.

5. Архитектура (60 минут)

«Pipeline для биллинга подписок», «event-pipeline для learning analytics», «архитектура DWH для product analytics».

6. Поведенческое + финал

STAR + стратегический разговор.

Что Skyeng ценит в DE

  • Event-driven mindset. События уроков, тестов.
  • Spark. Глубоко для batch.
  • ClickHouse. Для real-time витрин.
  • dbt. Для трансформаций, тестов, документации.
  • Product-mindset. DE — не «sklad данных», а инженер аналитики.

Типичные задачи и кейсы

  • «Pipeline для биллинга подписок: учёт trial → paid»
  • «Event-pipeline для уроков: students + teachers + interactions»
  • «ClickHouse витрина для real-time learning analytics»
  • «dbt-модель для cohort retention»
  • «Spark job на 1 TB событий — оптимизация»
Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Как готовиться: план

  1. Spark deep. RDD, DataFrame, optimizer, shuffle.
  2. ClickHouse. Engines, partitioning, MV.
  3. dbt. Models, ref, tests, snapshots.
  4. DWH. Star schema, SCD.
  5. Airflow. Airflow на собесе DE.

Частые ошибки

  • dbt поверхностно. В Skyeng dbt — стандарт.
  • ClickHouse поверхностно. Engines, partitioning — обязательно.
  • Слабая SQL. Senior-уровень.
  • Не понимать product analytics. DE должен думать про метрики продукта.

Связанные темы

FAQ

Сколько этапов в собеседовании на DE в Skyeng?

Обычно 5-6: рекрутер → SQL/Python → Spark → ClickHouse/dbt → архитектура → поведенческое + финал. Срок 4-6 недель.

Нужен ли EdTech-опыт?

Желателен. Релевантным считается subscription business с event-данными.

Какие инструменты главные?

Spark + ClickHouse + dbt + Airflow.

Спрашивают ли стриминг?

В отдельных командах — да.

Это официальная информация?

Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.