Стадии DWH на собеседовании Data Engineer

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Карьерник — Duolingo для аналитиков: 10 минут в день тренируй SQL, Python, A/B, статистику, метрики и ещё 3 темы собеса. 1500+ вопросов в Telegram-боте. Бесплатно.

Зачем спрашивают на собесе DE

DWH-слои — стандартная архитектура enterprise. На собесе DE: «отличие staging и ODS», «зачем DDS», «семантический слой».

Слои традиционного DWH

Source → Staging → ODS → DDS → Data Mart → Semantic Layer → BI

Каждый слой имеет свою цель. Современная медальон-архитектура (Bronze / Silver / Gold) — упрощённая версия.

Staging

Staging. Сырые данные из источника. Минимум трансформаций.

  • Append-only.
  • Сохраняем full payload (JSON / blob).
  • Type casts.
  • Audit columns: load_timestamp, source_file.

Аналог bronze. Хранится недолго (дни-недели), потом archive / drop.

ODS

Operational Data Store. Очищенные, нормализованные данные «как в проде».

  • 3НФ нормализация.
  • Lookups, валидация.
  • Дедупликация.
  • Снимок текущего состояния (overlay write).

Применение: запросы «текущее состояние», integration data из multiple sources.

В Inmon-подходе ODS — отдельный слой. В Kimball / lakehouse — часто пропускается.

DDS

Data Domain Store (или DV — Data Vault). Историческая нормализованная база.

  • SCD2 — все изменения сохраняются.
  • Hub / Link / Satellite (если Data Vault).
  • 3НФ + время.
  • Source of truth для history.

Аналог Silver layer + Inmon EDW.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Data Mart

Денормализованная под конкретное использование.

  • Star schema или snowflake.
  • Fact + dimension.
  • Pre-aggregated metrics.
  • Per business unit (Marketing mart, Finance mart).

Аналог Gold layer.

Semantic Layer

Бизнес-описание поверх marts. Позволяет business users делать ad-hoc analytics без SQL.

Tools: Looker LookML, dbt Semantic Layer, Cube.dev, AtScale.

Содержит:

  • Метрики (DAU, revenue) с definitions.
  • Dimensions с descriptions.
  • Joins автоматические.
  • Access control.

В 2026 — semantic layer становится стандартом для multi-team analytics.

Соотношение с медальоном

Традиционные Медальон
Staging Bronze
ODS / DDS Silver
Data Mart Gold
Semantic Layer Semantic Layer (over gold)

Медальон — упрощённая версия. В корп DWH (банки) часто всё ещё разделяют Staging / ODS / DDS / Mart explicitly.

Связанные темы

FAQ

Можно ли пропустить ODS?

Часто да. Если single source — ODS не даёт value. Если multiple sources — ODS помогает в integration.

Это официальная информация?

Нет. Статья основана на классике (Inmon / Kimball / Linstedt) и опыте отрасли.


Тренируйте Data Engineering — откройте тренажёр с 1500+ вопросами для собесов.