Inmon vs Kimball на собеседовании Data Engineer
Карьерник — Duolingo для аналитиков: 10 минут в день тренируй SQL, Python, A/B, статистику, метрики и ещё 3 темы собеса. 1500+ вопросов в Telegram-боте. Бесплатно.
Содержание:
Зачем разбирать на собесе
Inmon и Kimball — две классические школы DWH-моделирования. На собесе DE: «отличие подходов», «когда что выбрать», «связь с медальоном». Senior — нюансы корпоративных DWH, hub-and-spoke архитектуры.
Подход Inmon: top-down
Bill Inmon — «отец DWH». Подход:
- EDW (Enterprise Data Warehouse) — единое нормализованное хранилище (3НФ), source of truth для всей компании.
- Из EDW строятся data marts — денормализованные витрины под конкретные отделы / задачи.
Принципы:
- DWH — субъектно-ориентированный, integrated, time-variant, non-volatile.
- Нормализация защищает от inconsistency.
- Data marts — производная EDW, не источник.
Применение:
- Большие корпорации с зрелой архитектурой.
- Регуляторика требует единой версии правды.
- Долгий runway на построение (1+ год).
Подход Kimball: bottom-up
Ralph Kimball — альтернативный подход:
- Сразу строить data marts под бизнес-нужды (по отделам).
- Использовать conformed dimensions — общие dim-таблицы, которые согласованы между marts.
- Bus matrix — план, как marts связываются.
Принципы:
- Star schema (или snowflake) — fact-таблицы окружены dim-таблицами.
- Денормализация — для скорости запросов.
- Бизнес-ценность сразу с первого mart.
Применение:
- Стартапы и средний бизнес.
- Когда нужен быстрый ROI.
- BI-команды без больших дата-инженерных ресурсов.
Сравнительная таблица
| Inmon | Kimball | |
|---|---|---|
| Подход | Top-down (EDW → marts) | Bottom-up (marts → bus) |
| Модель | 3НФ в EDW, star в marts | Star schema, conformed dim |
| Скорость запуска | Медленно | Быстро |
| Time to value | 6-12+ мес | 1-3 мес на mart |
| Стоимость | Высокая | Средняя |
| Source of truth | Единое EDW | Conformed dims через marts |
| Интеграция новых источников | Сложно | Легко (новый mart) |
| Объём данных | Big, complex | Big or medium |
Гибридный подход
Современные DWH часто делают medallion architecture — гибрид:
- Bronze — сырьё (raw, minimal transformations). Похоже на Inmon staging.
- Silver — очищенные / нормализованные сущности. Близко к Inmon EDW.
- Gold — бизнес-витрины (star/snowflake). Похоже на Kimball marts.
Это компромисс — есть и единый source of truth, и быстрые витрины.
Что выбирают в РФ
Чистый Inmon:
- Сбер, ВТБ, крупные банки и страховщики (нужна регуляторика).
- Госсектор.
- Корпоративные DWH с 10+ лет историей.
Чистый Kimball:
- Avito, Wildberries (исторически), Ozon — продуктовые компании, BI-driven.
- Маркетинг-аналитические команды.
Медальон:
- Современные стек на Spark / Databricks / Snowflake.
- Iceberg / Delta Lake в основе.
- Большинство новых проектов в 2026.
Частые ошибки
Сразу делать «настоящий Inmon». На MVP — overkill. Marts быстрее показывают ценность.
Считать Kimball устаревшим. Star schema жива в 2026 — особенно с учётом колоночных движков (CH, BQ, Snowflake).
Игнорировать conformed dimensions в Kimball. Без них маркетинг и продукт оперируют разными «пользователями».
Делать EDW в 3НФ на ClickHouse. CH плохо джойнит — денормализация / star лучше для OLAP.
Не учитывать SCD. Inmon и Kimball оба требуют истории изменений измерений.
Перетаскивать паттерн без adaptation. Облачные DWH (Snowflake) меняют trade-offs — старые правила «нормализация дешевле» не работают.
Связанные темы
- Star schema vs Snowflake для DE
- SCD типы для DE
- DWH ClickHouse на собесе DE
- Lakehouse Iceberg Delta для DE
- Подготовка к собесу Data Engineer
FAQ
Какой подход в Snowflake / BigQuery?
Современные облачные DWH хорошо подходят под Kimball star schemas. Часть команд использует медальон поверх (raw vault → business vault → marts).
Conformed dimension — что это?
Dim-таблица, согласованная между разными marts. dim_user одинаковая в маркетинге и в продукте — иначе аналитика противоречит.
Data Vault — это Inmon или Kimball?
Ни то ни другое. Data Vault 2.0 (Linstedt) — третий подход с hub/link/satellite. Гибрид нормализации и historizable.
Это официальная информация?
Нет. Статья основана на работах Inmon (1992 «Building the Data Warehouse»), Kimball (2002 «The Data Warehouse Toolkit»).
Тренируйте Data Engineering — откройте тренажёр с 1500+ вопросами для собесов.