BI tools для Data Engineer на собеседовании

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Карьерник — Duolingo для аналитиков: 10 минут в день тренируй SQL, Python, A/B, статистику, метрики и ещё 3 темы собеса. 1500+ вопросов в Telegram-боте. Бесплатно.

Зачем DE знает BI

DE строит data marts для consumption аналитиками. Не зная BI quirks — модели плохо подходят.

Tableau

Industry-leading BI. Powerful viz, mature.

Pros: Любые vis, calculated fields, performance.

Cons: Дорого, learning curve. В РФ — ушёл с 2022.

Yandex DataLens

Yandex Cloud BI. Free tier exists.

Pros:

  • Native ClickHouse, Postgres connectors.
  • Интеграция с Yandex Cloud (DWH, datasets).
  • Material design UI.

Cons: функционал моложе чем Tableau.

В РФ — стандарт.

Apache Superset

Open source BI. Airbnb origin.

Pros: Free, self-host, SQL-first.

Cons: UI/UX хуже commercial. Performance limited на complex.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Metabase

Open source. Простой для начала.

Pros: Easy setup, business-user friendly.

Cons: Limited для complex analytics.

Looker

Google Cloud (GCP). LookML — code-based business model.

Pros: Version-controlled, governance.

Cons: Дорого. В РФ — недоступен.

DE perspective: model design

DE должен понимать BI patterns:

Star schema. BI tools love star — fact + dimension. Aggregations работают, drilldown OK.

Pre-aggregated tables. Live aggregation на TB-fact slow. Pre-compute daily / hourly.

Semantic layer. Tools want consistent definitions metrics. dbt semantic / Cube / LookML.

Indexes / cluster keys. На filter columns (date, country, segment).

Caching. BI tools have caches. DE должен not break them randomly.

Materialized views. Часто help BI performance.

Cardinality. High-cardinality (city с 50k unique) — sometimes problem для BI tools (slow filters).

Связанные темы

FAQ

Это официальная информация?

Нет. Статья основана на индустриальном опыте BI tools.


Тренируйте Data Engineering — откройте тренажёр с 1500+ вопросами для собесов.