Собеседование на BI-аналитика
Чем занимается BI-аналитик
BI-аналитик (Business Intelligence) превращает данные в визуальные отчёты и дашборды, по которым менеджеры принимают решения. Если аналитик данных — это исследователь, который копается в данных и ищет инсайты, то BI-аналитик — переводчик, который делает данные понятными для всей компании.
Основные направления работы:
Создание дашбордов и отчётов. BI-аналитик проектирует и строит дашборды в Tableau, Power BI, Looker или другом инструменте. Это не просто «перетащить поле на график» — нужно понять, какие метрики важны для конкретного стейкхолдера, как их визуализировать, как обеспечить интерактивность без перегрузки.
Моделирование данных для BI. Данные в исходных таблицах редко подходят для визуализации напрямую. BI-аналитик создаёт модели данных — промежуточные витрины, вычисляемые поля, связи между таблицами — чтобы дашборд работал быстро и показывал правильные числа.
Поддержка и развитие отчётности. Дашборды живут: метрики меняются, добавляются новые источники, пользователи просят фильтры и детализации. BI-аналитик поддерживает существующую отчётность, оптимизирует производительность, обучает пользователей.
Чем BI-аналитик отличается от аналитика данных
| BI-аналитик | Аналитик данных | |
|---|---|---|
| Фокус | Визуализация и отчётность | Исследование данных и инсайты |
| Основной продукт | Дашборды, автоматические отчёты | Ad-hoc анализ, A/B-тесты, модели |
| Инструменты | Tableau, Power BI, Looker + SQL | SQL, Python, pandas + BI-инструменты |
| SQL-уровень | Средний (запросы для витрин) | Продвинутый (оконные функции, CTE) |
| Аудитория | Менеджеры, директора, вся компания | Продуктовая команда, аналитики |
| Статистика | Базовая (средние, медианы, тренды) | Продвинутая (гипотезы, A/B, регрессия) |
На практике роли пересекаются. В небольших компаниях аналитик данных строит и дашборды, и проводит исследования. В крупных — BI-аналитик может не заниматься A/B-тестами, но должен глубоко разбираться в визуализации и моделировании данных. Подробнее о разных ролях — в статье Типы аналитиков: отличия.
Этапы собеседования
Типичный процесс для BI-аналитика — 3–4 этапа:
1. HR-скрининг. Мотивация, ожидания, опыт. «С какими BI-инструментами работали?», «Какой самый сложный дашборд строили?», «Сколько пользователей у вашей отчётности?»
2. SQL-интервью. 30–60 минут. Проверяют базовый и средний уровень SQL. Задачи ближе к подготовке данных для отчётов, чем к сложной аналитике. Подробнее — ниже.
3. Практическое задание / кейс. Построить дашборд по реальным данным, или разобрать кейс: «Бизнесу нужен дашборд по продажам — что покажете, как организуете, какие фильтры добавите?» Могут дать тестовое на дом или провести live-сессию.
4. Финальное интервью. Разговор с руководителем. Обсуждение опыта, подхода к работе, умения общаться с бизнесом.
Tableau и Power BI: вопросы на собеседовании
Tableau
«Чем отличается мера от измерения?» Измерение (dimension) — категориальные данные: регион, продукт, дата. Мера (measure) — количественные данные: выручка, количество заказов. Tableau автоматически определяет тип, но не всегда правильно — числовой ID это измерение, а не мера.
«Что такое LOD-выражения?» Level of Detail выражения позволяют агрегировать данные на уровне, отличном от текущего уровня визуализации. FIXED — агрегация по указанным измерениям, независимо от фильтров. INCLUDE — добавляет измерение к текущей детализации. EXCLUDE — убирает измерение. Пример: {FIXED [user_id] : MIN([order_date])} — дата первого заказа каждого пользователя, независимо от фильтров на дашборде.
«Как оптимизировать медленный дашборд?» Уменьшить количество листов, использовать экстракты вместо live-подключений, оптимизировать вычисления (заменить табличные вычисления на LOD, где возможно), уменьшить детализацию данных, использовать контекстные фильтры.
«Что такое параметр и как его использовать?» Параметр — пользовательская переменная, которая позволяет менять поведение визуализации: переключать метрику, задавать порог, менять период. В отличие от фильтра, параметр не фильтрует данные напрямую — он используется в вычислениях.
Power BI
«Что такое DAX и чем он отличается от M (Power Query)?» M — язык трансформации данных на этапе загрузки (ETL). DAX — язык аналитических выражений для создания мер и вычисляемых колонок в модели данных. M работает до загрузки в модель, DAX — после.
«Чем отличается мера от вычисляемого столбца?» Мера вычисляется в момент запроса и зависит от контекста фильтра. Вычисляемый столбец вычисляется при обновлении данных и хранится в модели. Меры — для агрегаций (сумма продаж, количество клиентов), вычисляемые столбцы — для значений на уровне строки (категория клиента, флаг).
«Как реализовать Row-Level Security?» Создать роль в модели, определить DAX-выражение для фильтрации (например, [Region] = USERPRINCIPALNAME()), назначить пользователей ролям. RLS гарантирует, что менеджер видит только данные своего региона.
«Как оптимизировать производительность отчёта?» Уменьшить количество столбцов и таблиц в модели, использовать агрегации, заменить вычисляемые столбцы мерами где возможно, использовать DirectQuery с осторожностью (Import обычно быстрее), проверить кардинальность связей.
Дизайн дашбордов
Отдельный блок вопросов — принципы проектирования дашбордов. BI-аналитик должен не просто показать данные, а сделать так, чтобы пользователь за 10 секунд понял ключевые показатели.
Правило перевёрнутой пирамиды. Наверху — ключевые KPI (крупные числа, тренд). В середине — детализация по разрезам (регион, продукт, канал). Внизу — таблицы для drill-down. Пользователь сначала видит общую картину, потом углубляется при необходимости.
Выбор типа графика. Это частый вопрос на собеседовании: «Когда использовать линейный график, а когда столбчатый?» Линейный — для трендов во времени. Столбчатый — для сравнения категорий. Круговая диаграмма — почти никогда (серьёзно). Scatter plot — для корреляции двух числовых показателей. Heatmap — для матриц с двумя измерениями. Подробнее — в статье Типы графиков для аналитика.
Цвет и акценты. Не больше 3–5 цветов на дашборде. Красный — только для негативных отклонений, зелёный — для позитивных. Серый — для контекста и вспомогательных элементов. Яркие цвета — только для того, на что нужно обратить внимание.
Интерактивность. Фильтры должны быть очевидными и не ломать логику. Cross-filtering (клик на одном графике фильтрует остальные) — мощный инструмент, но нужно тестировать: пользователь должен понимать, что произошло. Tooltips — для дополнительной информации без загромождения.
На собеседовании могут показать плохой дашборд и попросить назвать проблемы. Типичные: слишком много графиков на одной странице, непонятные названия метрик, неподходящий тип визуализации, отсутствие контекста (число без сравнения не информативно).
Моделирование данных: star schema
BI-аналитик должен понимать, как устроены данные в хранилище. Самая распространённая модель — star schema (звёздная схема).
Таблица фактов — центральная таблица с транзакциями или событиями. Каждая строка — один факт: продажа, клик, визит. Содержит числовые метрики (сумма, количество) и внешние ключи к таблицам измерений.
Таблицы измерений — справочники: клиенты, продукты, даты, регионы. Содержат атрибуты для фильтрации, группировки и детализации.
Пример: таблица фактов sales содержит date_id, product_id, customer_id, amount, quantity. Таблицы измерений: dim_date (год, месяц, квартал, день недели), dim_product (название, категория, бренд), dim_customer (имя, регион, сегмент).
На собеседовании могут спросить:
«Чем star schema отличается от snowflake schema?» В star schema измерения денормализованы — один уровень справочников. В snowflake — измерения разбиты на подуровни (product -> category -> department). Star проще для BI-инструментов и быстрее для запросов. Snowflake экономит место и лучше для нормализации, но сложнее для конечного пользователя.
«Зачем нужна таблица dim_date?» Чтобы фильтровать и группировать по любому атрибуту даты без вычислений в рантайме: год, квартал, месяц, день недели, рабочий/выходной, финансовый год. Без неё каждый отчёт будет извлекать эти атрибуты из timestamp — медленнее и менее удобно.
«Что такое SCD (Slowly Changing Dimensions)?» Измерения, которые меняются со временем. Клиент переехал в другой город, продукт сменил категорию. Type 1 — перезаписываем старое значение (теряем историю). Type 2 — добавляем новую строку с датами начала и конца действия (сохраняем историю). На практике Type 2 — стандарт для BI.
SQL для BI-аналитика
SQL-блок на собеседовании BI-аналитика проще, чем для аналитика данных, но его не пропускают. Проверяют:
- SELECT, WHERE, GROUP BY, ORDER BY — уверенный базовый уровень.
- JOIN — INNER, LEFT. Понимание, зачем нужен LEFT JOIN и что произойдёт, если в справочнике нет записи.
- Агрегатные функции: COUNT, SUM, AVG, MAX, MIN.
- CASE WHEN — условная логика для создания категорий и флагов.
- Базовые оконные функции — ROW_NUMBER, RANK для нумерации и ранжирования.
Типичная задача: «Есть таблица sales (sale_id, product_id, region, amount, sale_date). Посчитайте выручку по регионам за каждый месяц, отсортируйте по убыванию».
SELECT
region,
DATE_TRUNC('month', sale_date) AS sale_month,
SUM(amount) AS total_revenue
FROM sales
GROUP BY region, DATE_TRUNC('month', sale_date)
ORDER BY total_revenue DESCBI-аналитику чаще дают задачи на подготовку витрин для дашбордов, чем на сложную аналитику. Готовиться к SQL можно в SQL-тренажёре и по примерам вопросов.
Как готовиться
Освойте один BI-инструмент на продвинутом уровне. Tableau или Power BI — зависит от вакансии. «На продвинутом уровне» означает: LOD-выражения / DAX, оптимизация, параметры, действия, моделирование данных. Базовое «перетаскивание полей» есть у всех кандидатов — вам нужно выделиться.
Создайте портфолио из 2–3 дашбордов. Возьмите открытые датасеты (Superstore для Tableau, AdventureWorks для Power BI), постройте дашборд с продуманной структурой, интерактивностью и дизайном. Опубликуйте на Tableau Public или в Power BI Service. Это показывает навык лучше любого рассказа.
Подтяните SQL. Он проверяется на каждом собеседовании. Базовый уровень — JOIN, GROUP BY, CASE WHEN, простые оконные функции. Подробнее — в разделе SQL.
Разберитесь в моделировании данных. Star schema, snowflake, SCD — это спрашивают на каждом втором собеседовании. Поймите, как структура данных влияет на производительность и удобство отчётов.
Научитесь объяснять свои решения. На собеседовании дашборд — не просто картинка. Вас спросят: «Почему выбрали этот тип графика?», «Почему эта метрика наверху?», «Как пользователь поймёт, что показатель снизился?» Подготовьте обоснование для каждого элемента.
Читайте также
- Вопросы по SQL на собеседовании
- Примеры вопросов
- Статистика для аналитика
- Типы аналитиков: отличия
- Подготовка к собеседованию аналитика
FAQ
Нужен ли BI-аналитику Python?
В большинстве вакансий — нет. BI-аналитик работает в визуальных инструментах (Tableau, Power BI) и пишет SQL для подготовки данных. Python может быть полезен для автоматизации (обновление данных, генерация отчётов), но на собеседованиях его почти никогда не спрашивают. Если вы хотите расти в сторону аналитики данных — Python стоит изучить. Подробнее — в статье Python для аналитика.
Tableau или Power BI — что учить?
Зависит от рынка и целевых компаний. В России Power BI встречается чаще — Microsoft-стек распространён в корпорациях. Tableau популярнее в международных компаниях и стартапах. Если не знаете, куда пойдёте — начинайте с Power BI, он бесплатен для личного использования. Навыки переносятся: принципы визуализации и моделирования одинаковы.
Сколько времени нужно на подготовку?
Если у вас есть опыт работы с данными (аналитик, Excel-мастер, 1С-специалист) — 2–3 недели. Ключевые темы: BI-инструмент (LOD/DAX, оптимизация), SQL (JOIN, GROUP BY, CASE), моделирование данных (star schema), дизайн дашбордов. Если входите с нуля — 6–8 недель с упором на один BI-инструмент и SQL.
Чем BI-аналитик отличается от BI-разработчика?
BI-аналитик ближе к бизнесу: понимает метрики, проектирует дашборды, общается со стейкхолдерами. BI-разработчик ближе к инфраструктуре: настраивает ETL-процессы, оптимизирует хранилище, администрирует BI-платформу. В небольших компаниях это одна роль. В крупных — аналитик говорит «мне нужна такая витрина», а разработчик её создаёт.
Потренируйтесь решать задачи для аналитиков — откройте тренажёр с SQL-задачами и вопросами по метрикам.