Собеседование на Data Engineer в Skyeng
Содержание:
Почему Skyeng — особенный работодатель для DE
Skyeng — один из крупнейших EdTech-сервисов РФ. DE работает над pipelines пользовательских событий (уроки, тесты, домашние задания), биллингом подписок, ML-фичами для рекомендаций уроков и преподавателей.
Особенность: EdTech продукт имеет специфику — длинные циклы (студенты учатся месяцами), пиковая нагрузка (вечера, выходные), много событий (interaction-based learning). Стэк: Spark / Hadoop для batch, ClickHouse для аналитики, dbt для трансформаций, Airflow для оркестрации. Подробнее — на странице карьеры Skyeng.
Информация в статье основана на публичных источниках и опыте кандидатов. Формат может отличаться по командам и грейдам. Уточняйте у рекрутера.
Этапы собеседования
1. Скрининг с рекрутером (30 минут)
Опыт, мотивация. Специфика:
- Был ли опыт с event-данными
- Знание SQL deep + Python
- Готовность к продуктовому подходу
2. SQL и Python (60 минут)
SQL — middle-senior. Python — pandas, pyspark.
3. Big Data + Spark (60-90 минут)
Spark на event-данных.
4. ClickHouse + dbt (45-60 минут)
ClickHouse для real-time витрин. dbt для трансформаций, тестов, snapshots.
5. Архитектура (60 минут)
«Pipeline для биллинга подписок», «event-pipeline для learning analytics», «архитектура DWH для product analytics».
6. Поведенческое + финал
STAR + стратегический разговор.
Что Skyeng ценит в DE
- Event-driven mindset. События уроков, тестов.
- Spark. Глубоко для batch.
- ClickHouse. Для real-time витрин.
- dbt. Для трансформаций, тестов, документации.
- Product-mindset. DE — не «sklad данных», а инженер аналитики.
Типичные задачи и кейсы
- «Pipeline для биллинга подписок: учёт trial → paid»
- «Event-pipeline для уроков: students + teachers + interactions»
- «ClickHouse витрина для real-time learning analytics»
- «dbt-модель для cohort retention»
- «Spark job на 1 TB событий — оптимизация»
Как готовиться: план
- Spark deep. RDD, DataFrame, optimizer, shuffle.
- ClickHouse. Engines, partitioning, MV.
- dbt. Models, ref, tests, snapshots.
- DWH. Star schema, SCD.
- Airflow. Airflow на собесе DE.
Частые ошибки
- dbt поверхностно. В Skyeng dbt — стандарт.
- ClickHouse поверхностно. Engines, partitioning — обязательно.
- Слабая SQL. Senior-уровень.
- Не понимать product analytics. DE должен думать про метрики продукта.
Связанные темы
- Собеседование на DE в Avito
- Собеседование на DE в Я.Маркет
- Spark на собесе DE
- ClickHouse и OLAP
- Собеседование на DS в Skyeng
FAQ
Сколько этапов в собеседовании на DE в Skyeng?
Обычно 5-6: рекрутер → SQL/Python → Spark → ClickHouse/dbt → архитектура → поведенческое + финал. Срок 4-6 недель.
Нужен ли EdTech-опыт?
Желателен. Релевантным считается subscription business с event-данными.
Какие инструменты главные?
Spark + ClickHouse + dbt + Airflow.
Спрашивают ли стриминг?
В отдельных командах — да.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.