Стадии DWH на собеседовании Data Engineer
Карьерник — Duolingo для аналитиков: 10 минут в день тренируй SQL, Python, A/B, статистику, метрики и ещё 3 темы собеса. 1500+ вопросов в Telegram-боте. Бесплатно.
Содержание:
Зачем спрашивают на собесе DE
DWH-слои — стандартная архитектура enterprise. На собесе DE: «отличие staging и ODS», «зачем DDS», «семантический слой».
Слои традиционного DWH
Source → Staging → ODS → DDS → Data Mart → Semantic Layer → BIКаждый слой имеет свою цель. Современная медальон-архитектура (Bronze / Silver / Gold) — упрощённая версия.
Staging
Staging. Сырые данные из источника. Минимум трансформаций.
- Append-only.
- Сохраняем full payload (JSON / blob).
- Type casts.
- Audit columns: load_timestamp, source_file.
Аналог bronze. Хранится недолго (дни-недели), потом archive / drop.
ODS
Operational Data Store. Очищенные, нормализованные данные «как в проде».
- 3НФ нормализация.
- Lookups, валидация.
- Дедупликация.
- Снимок текущего состояния (overlay write).
Применение: запросы «текущее состояние», integration data из multiple sources.
В Inmon-подходе ODS — отдельный слой. В Kimball / lakehouse — часто пропускается.
DDS
Data Domain Store (или DV — Data Vault). Историческая нормализованная база.
- SCD2 — все изменения сохраняются.
- Hub / Link / Satellite (если Data Vault).
- 3НФ + время.
- Source of truth для history.
Аналог Silver layer + Inmon EDW.
Data Mart
Денормализованная под конкретное использование.
- Star schema или snowflake.
- Fact + dimension.
- Pre-aggregated metrics.
- Per business unit (Marketing mart, Finance mart).
Аналог Gold layer.
Semantic Layer
Бизнес-описание поверх marts. Позволяет business users делать ad-hoc analytics без SQL.
Tools: Looker LookML, dbt Semantic Layer, Cube.dev, AtScale.
Содержит:
- Метрики (DAU, revenue) с definitions.
- Dimensions с descriptions.
- Joins автоматические.
- Access control.
В 2026 — semantic layer становится стандартом для multi-team analytics.
Соотношение с медальоном
| Традиционные | Медальон |
|---|---|
| Staging | Bronze |
| ODS / DDS | Silver |
| Data Mart | Gold |
| Semantic Layer | Semantic Layer (over gold) |
Медальон — упрощённая версия. В корп DWH (банки) часто всё ещё разделяют Staging / ODS / DDS / Mart explicitly.
Связанные темы
- Inmon vs Kimball для DE
- Медальон-архитектура для DE
- Star schema vs Snowflake для DE
- Data Vault 2.0 для DE
- Подготовка к собесу Data Engineer
FAQ
Можно ли пропустить ODS?
Часто да. Если single source — ODS не даёт value. Если multiple sources — ODS помогает в integration.
Это официальная информация?
Нет. Статья основана на классике (Inmon / Kimball / Linstedt) и опыте отрасли.
Тренируйте Data Engineering — откройте тренажёр с 1500+ вопросами для собесов.