Inmon vs Kimball на собеседовании Data Engineer

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Карьерник — Duolingo для аналитиков: 10 минут в день тренируй SQL, Python, A/B, статистику, метрики и ещё 3 темы собеса. 1500+ вопросов в Telegram-боте. Бесплатно.

Зачем разбирать на собесе

Inmon и Kimball — две классические школы DWH-моделирования. На собесе DE: «отличие подходов», «когда что выбрать», «связь с медальоном». Senior — нюансы корпоративных DWH, hub-and-spoke архитектуры.

Подход Inmon: top-down

Bill Inmon — «отец DWH». Подход:

  1. EDW (Enterprise Data Warehouse) — единое нормализованное хранилище (3НФ), source of truth для всей компании.
  2. Из EDW строятся data marts — денормализованные витрины под конкретные отделы / задачи.

Принципы:

  • DWH — субъектно-ориентированный, integrated, time-variant, non-volatile.
  • Нормализация защищает от inconsistency.
  • Data marts — производная EDW, не источник.

Применение:

  • Большие корпорации с зрелой архитектурой.
  • Регуляторика требует единой версии правды.
  • Долгий runway на построение (1+ год).

Подход Kimball: bottom-up

Ralph Kimball — альтернативный подход:

  1. Сразу строить data marts под бизнес-нужды (по отделам).
  2. Использовать conformed dimensions — общие dim-таблицы, которые согласованы между marts.
  3. Bus matrix — план, как marts связываются.

Принципы:

  • Star schema (или snowflake) — fact-таблицы окружены dim-таблицами.
  • Денормализация — для скорости запросов.
  • Бизнес-ценность сразу с первого mart.

Применение:

  • Стартапы и средний бизнес.
  • Когда нужен быстрый ROI.
  • BI-команды без больших дата-инженерных ресурсов.

Сравнительная таблица

Inmon Kimball
Подход Top-down (EDW → marts) Bottom-up (marts → bus)
Модель 3НФ в EDW, star в marts Star schema, conformed dim
Скорость запуска Медленно Быстро
Time to value 6-12+ мес 1-3 мес на mart
Стоимость Высокая Средняя
Source of truth Единое EDW Conformed dims через marts
Интеграция новых источников Сложно Легко (новый mart)
Объём данных Big, complex Big or medium
Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Гибридный подход

Современные DWH часто делают medallion architecture — гибрид:

  • Bronze — сырьё (raw, minimal transformations). Похоже на Inmon staging.
  • Silver — очищенные / нормализованные сущности. Близко к Inmon EDW.
  • Gold — бизнес-витрины (star/snowflake). Похоже на Kimball marts.

Это компромисс — есть и единый source of truth, и быстрые витрины.

Что выбирают в РФ

Чистый Inmon:

  • Сбер, ВТБ, крупные банки и страховщики (нужна регуляторика).
  • Госсектор.
  • Корпоративные DWH с 10+ лет историей.

Чистый Kimball:

  • Avito, Wildberries (исторически), Ozon — продуктовые компании, BI-driven.
  • Маркетинг-аналитические команды.

Медальон:

  • Современные стек на Spark / Databricks / Snowflake.
  • Iceberg / Delta Lake в основе.
  • Большинство новых проектов в 2026.

Частые ошибки

Сразу делать «настоящий Inmon». На MVP — overkill. Marts быстрее показывают ценность.

Считать Kimball устаревшим. Star schema жива в 2026 — особенно с учётом колоночных движков (CH, BQ, Snowflake).

Игнорировать conformed dimensions в Kimball. Без них маркетинг и продукт оперируют разными «пользователями».

Делать EDW в 3НФ на ClickHouse. CH плохо джойнит — денормализация / star лучше для OLAP.

Не учитывать SCD. Inmon и Kimball оба требуют истории изменений измерений.

Перетаскивать паттерн без adaptation. Облачные DWH (Snowflake) меняют trade-offs — старые правила «нормализация дешевле» не работают.

Связанные темы

FAQ

Какой подход в Snowflake / BigQuery?

Современные облачные DWH хорошо подходят под Kimball star schemas. Часть команд использует медальон поверх (raw vault → business vault → marts).

Conformed dimension — что это?

Dim-таблица, согласованная между разными marts. dim_user одинаковая в маркетинге и в продукте — иначе аналитика противоречит.

Data Vault — это Inmon или Kimball?

Ни то ни другое. Data Vault 2.0 (Linstedt) — третий подход с hub/link/satellite. Гибрид нормализации и historizable.

Это официальная информация?

Нет. Статья основана на работах Inmon (1992 «Building the Data Warehouse»), Kimball (2002 «The Data Warehouse Toolkit»).


Тренируйте Data Engineering — откройте тренажёр с 1500+ вопросами для собесов.