Что нужно знать аналитику данных: навыки для junior

Краткий список

Чтобы претендовать на позицию junior-аналитика данных в 2026, нужно знать:

  1. SQL — обязательно, на глубину оконных функций.
  2. Продуктовые метрики — retention, DAU, воронки, unit-экономика.
  3. Базовая статистика — p-value, доверительные интервалы, A/B-тесты.
  4. Python + pandas — базовый уровень.
  5. BI-инструмент — один из (Tableau, Power BI, Metabase).
  6. Excel / Google Sheets — продвинутый уровень (формулы, сводные).
  7. Soft skills — структурное мышление, коммуникация, продуктовая intuition.

Ниже — детали с приоритетами.

Tier 1 — без этого не возьмут

SQL — 95% собеседований

Обязательно:

  • SELECT, WHERE, ORDER BY, LIMIT.
  • JOIN: INNER, LEFT, с пониманием дублирования строк.
  • GROUP BY + агрегаты (COUNT, SUM, AVG + DISTINCT).
  • HAVING (отличие от WHERE).
  • Подзапросы, CTE.
  • Оконные функции: ROW_NUMBER, LAG, LEAD, SUM OVER.
  • Работа с датами: DATE_TRUNC, EXTRACT, INTERVAL.
  • NULL-обработка: IS NULL, COALESCE, NULLIF.
  • CASE WHEN.

Шпаргалки:

Продуктовые метрики

Обязательно:

  • DAU, MAU, WAU + stickiness.
  • Retention: D1, D7, D30, когортный.
  • Воронка конверсии, drop-off.
  • Unit-экономика: ARPU, ARPPU, LTV, CAC, payback.
  • North Star metric, guardrails.

Без этого на собесе вас не возьмут, даже с крутым SQL.

Ресурсы:

Статистика

Минимум:

  • p-value, α, β, мощность.
  • Нормальное распределение, ЦПТ.
  • Доверительные интервалы.
  • Ошибки I и II рода.
  • Корреляция vs причинность.

Ресурсы:

A/B-тесты

Обязательно:

  • Дизайн эксперимента, MDE, размер выборки.
  • Интерпретация результата: значим / не значим.
  • Guardrail-метрики.
  • Ошибки: peeking, SRM, multiple comparisons.

Ресурсы:

Tier 2 — сильно ускоряет трудоустройство

Python + pandas

Минимум:

  • Базовый синтаксис: переменные, циклы, функции.
  • Pandas: DataFrame, Series, groupby, merge.
  • NumPy: базовые массивы.
  • Matplotlib/seaborn: простые графики.

Шпаргалки:

BI-инструмент

Один из: Tableau, Power BI, Metabase, Superset, DataLens.

Что уметь:

  • Подключить источник данных.
  • Построить 5–7 базовых виджетов (линии, бары, pie, table).
  • Calculated fields / meta-measures.
  • Фильтры и дашборд для стейкхолдера.

Excel / Google Sheets

Уметь:

  • VLOOKUP, INDEX/MATCH.
  • Pivot tables.
  • Формулы: IF, SUMIFS, COUNTIFS.
  • Построение графиков.

Многие аналитики работают в Excel каждый день, даже имея SQL и BI.

Больше таких примеров с разборами — в Telegram-тренажёре. Короткие сессии, прогресс по темам, объяснения после каждого ответа.

Tier 3 — желательно, но не обязательно

Визуализация / data storytelling

  • Принципы data viz.
  • Когда какой график.
  • Структура презентации результатов.

Ресурсы, ошибки визуализации.

Git

Хотя бы базовое — clone, commit, push, pull. На работе вам нужно будет коммитить SQL-код в репозиторий.

Подробнее.

Основы ML (для middle+)

  • Линейная/логистическая регрессия.
  • Decision Tree, Random Forest.
  • Concept: train/test, overfitting.

Глубокое знание ML — это Data Scientist, не аналитик.

dbt, Airflow (для «DA + DE» ролей)

  • dbt для трансформации данных.
  • Airflow для ETL-оркестрации.

Если работаете в современном стеке — плюс.

Soft skills

Часто недооценивают. На middle+ они важнее технических.

Структурное мышление

Умение разложить кейс на части, задать правильные вопросы, выстроить логику ответа. На собесе именно это проверяют кейсами типа «метрика упала».

Коммуникация

  • Объяснить сложное простыми словами.
  • Написать краткое summary на 5 строк.
  • Выступить на 5-минутной презентации дашборда.

Продуктовая интуиция

Понимать, зачем вы считаете метрику. Какие бизнес-решения от неё зависят. Что делать с результатом.

Работа с неоднозначностью

Аналитик часто получает кривые данные, противоречивые запросы, незаконченные постановки задач. Нужно уметь двигаться вперёд в тумане.

Что НЕ обязательно

Математический анализ

Интегралы и дифференциалы в аналитике не используются. Школьной алгебры достаточно.

Deep Learning

Нейросети — это Data Scientist. Для аналитика знать по верхам — ок, углубляться — не надо.

Продвинутый Python (классы, декораторы)

На junior-позиции. На middle+ — полезно, но не критично.

Hadoop

Устаревший, даже в больших компаниях заменяется на Spark и облачные стеки.

Если готовишься к собесу — бот @kariernik_bot закрывает 80% технических вопросов. SQL, Python, A/B, продуктовые метрики — всё в одном месте.

Приоритеты по времени

Если у вас 4 месяца, вложите время так:

  • 30% — SQL. Это фундамент, с которым вас возьмут.
  • 20% — продуктовые метрики. Без этого SQL бесполезен.
  • 15% — статистика + A/B. Обязательная теория.
  • 15% — Python + pandas. Для middle+.
  • 10% — BI + визуализация. Дашборд в портфолио.
  • 10% — soft skills + портфолио. Подготовка к собесам.

Читайте также

FAQ

Что важнее — SQL или Python?

SQL. 95% собеседований фокусируются на нём. Python — бонус для middle+.

Нужно ли ML?

Для аналитика — по верхам. Для DS — да, глубоко.

Какой BI-инструмент выбрать?

Любой из популярных (Tableau, Power BI, Metabase). Один, но хорошо. Переключиться на другой займёт 1–2 недели.

Как проверить, что я готов?

Пройдите 3–5 собеседований. Если проваливаете на SQL — учить SQL. На кейсах — учить продуктовые метрики. Обратная связь с собесов — лучший индикатор.