Собеседование на Data Engineer в Самокате
Содержание:
Почему Самокат — особенный работодатель для DE
Самокат — лидер сегмента q-commerce (доставка продуктов за 15 минут) в РФ. Часть холдинга Сбер. Domain: hyperlocal delivery, real-time inventory по микрорайонам, dark stores. Стек: ClickHouse + Airflow + Kafka + Spark + PostgreSQL + dbt + cloud (SberCloud / VK Cloud).
DE в Самокате работает с real-time pipelines: inventory обновляется секунды, ассортимент свежий, доставка в режиме «вот-вот». Объёмы данных — миллионы заказов в день, миллиарды событий. Команды cross-functional, ML-направление активно растёт.
Актуальные вакансии — на career.samokat.ru.
Информация основана на публичных источниках и опыте кандидатов. Команды Самоката используют разные процессы — уточняйте у рекрутера.
Этапы собеседования
1. HR-скрининг (30-45 минут)
Знакомство:
- Стек: ClickHouse / Airflow / Kafka / Spark
- Опыт в e-com / доставке / quick commerce
- Motivation
Питч 90 секунд: продукт, объёмы, инструменты, impact.
2. SQL deep (60-90 минут)
В Самокате DE пишет много SQL для real-time и batch.
Темы:
- Window functions, CTE
- ClickHouse-specific: MergeTree, materialized views
- ETL-паттерны
- Late-arriving data, дедупликация
Подготовка: SQL для DE.
3. Python + ETL (60-90 минут)
Live coding.
- Pandas / SQL pipelines
- dbt и трансформации
- Airflow DAGs
Подготовка: Airflow паттерны, dbt и моделирование.
4. System design (60-90 минут)
Кейсы:
- Real-time inventory pipeline
- Pipeline для прогнозирования заказов
- ETL для аналитики курьеров и доставки
- Dynamic pricing pipeline
Подготовка: Kafka streaming, CDC, data modeling.
5. Поведенческое (45-60 минут)
STAR: peak инциденты, кросс-командные проекты, ownership.
Особенности по командам
Inventory / Real-time: обновление остатков по dark stores.
Demand Forecasting: прогноз заказов, оптимизация ассортимента.
Аналитика курьеров: routing, эффективность доставки.
Marketing Analytics: attribution, cohort, CRM.
ML / Pricing: dynamic pricing, recommendations.
Что Самокат ценит в DE
- SQL + ClickHouse. Базовый билет.
- Real-time опыт. Kafka, Spark Streaming.
- dbt / Airflow. Стандарт для ETL.
- E-com / доставка domain. Понимание quick commerce.
- Reliability. Inventory error = order cancel.
Как готовиться: план
За 4-6 недель:
- Неделя 1-2 — SQL + ClickHouse. SQL для DE, ClickHouse.
- Неделя 3 — Python + Airflow + dbt. Airflow, dbt.
- Неделя 4 — System design. Real-time. Kafka, CDC.
- Неделя 5 — Monitoring + cloud. мониторинг, cloud.
- Неделя 6 — Mocks + behavioral.
Частые ошибки
- Слабый ClickHouse.
- Без real-time опыта. Quick commerce требует.
- Без dbt / Airflow. Стандарт.
- Игнор доставки domain. Не покажешь экспертизу.
- Без monitoring. Inventory error = order cancel.
Связанные темы
- Собеседование на Data Engineer
- SQL для DE
- ClickHouse и OLAP
- Airflow паттерны
- Kafka streaming
- CDC и event sourcing
FAQ
Удалёнка в Самокате для DE?
Гибрид часто.
Зарплатные вилки 2026?
Middle DE: 230-360k. Senior: 360-520k.
Английский нужен?
Не обязателен.
Сколько этапов?
3-4 этапа, 1-2 недели.
Это официальная информация?
Этапы основаны на публичных источниках и опыте кандидатов. Уточняйте у рекрутера.