BI tools для Data Engineer на собеседовании
Карьерник — Duolingo для аналитиков: 10 минут в день тренируй SQL, Python, A/B, статистику, метрики и ещё 3 темы собеса. 1500+ вопросов в Telegram-боте. Бесплатно.
Содержание:
Зачем DE знает BI
DE строит data marts для consumption аналитиками. Не зная BI quirks — модели плохо подходят.
Tableau
Industry-leading BI. Powerful viz, mature.
Pros: Любые vis, calculated fields, performance.
Cons: Дорого, learning curve. В РФ — ушёл с 2022.
Yandex DataLens
Yandex Cloud BI. Free tier exists.
Pros:
- Native ClickHouse, Postgres connectors.
- Интеграция с Yandex Cloud (DWH, datasets).
- Material design UI.
Cons: функционал моложе чем Tableau.
В РФ — стандарт.
Apache Superset
Open source BI. Airbnb origin.
Pros: Free, self-host, SQL-first.
Cons: UI/UX хуже commercial. Performance limited на complex.
Metabase
Open source. Простой для начала.
Pros: Easy setup, business-user friendly.
Cons: Limited для complex analytics.
Looker
Google Cloud (GCP). LookML — code-based business model.
Pros: Version-controlled, governance.
Cons: Дорого. В РФ — недоступен.
DE perspective: model design
DE должен понимать BI patterns:
Star schema. BI tools love star — fact + dimension. Aggregations работают, drilldown OK.
Pre-aggregated tables. Live aggregation на TB-fact slow. Pre-compute daily / hourly.
Semantic layer. Tools want consistent definitions metrics. dbt semantic / Cube / LookML.
Indexes / cluster keys. На filter columns (date, country, segment).
Caching. BI tools have caches. DE должен not break them randomly.
Materialized views. Часто help BI performance.
Cardinality. High-cardinality (city с 50k unique) — sometimes problem для BI tools (slow filters).
Связанные темы
- DWH ClickHouse для DE
- DWH stages для DE
- Star schema vs Snowflake для DE
- Looker и LookML для аналитика
- Подготовка к собесу Data Engineer
FAQ
Это официальная информация?
Нет. Статья основана на индустриальном опыте BI tools.
Тренируйте Data Engineering — откройте тренажёр с 1500+ вопросами для собесов.