Что нужно знать аналитику данных: навыки для junior
Краткий список
Чтобы претендовать на позицию junior-аналитика данных в 2026, нужно знать:
- SQL — обязательно, на глубину оконных функций.
- Продуктовые метрики — retention, DAU, воронки, unit-экономика.
- Базовая статистика — p-value, доверительные интервалы, A/B-тесты.
- Python + pandas — базовый уровень.
- BI-инструмент — один из (Tableau, Power BI, Metabase).
- Excel / Google Sheets — продвинутый уровень (формулы, сводные).
- Soft skills — структурное мышление, коммуникация, продуктовая intuition.
Ниже — детали с приоритетами.
Tier 1 — без этого не возьмут
SQL — 95% собеседований
Обязательно:
- SELECT, WHERE, ORDER BY, LIMIT.
- JOIN: INNER, LEFT, с пониманием дублирования строк.
- GROUP BY + агрегаты (COUNT, SUM, AVG + DISTINCT).
- HAVING (отличие от WHERE).
- Подзапросы, CTE.
- Оконные функции: ROW_NUMBER, LAG, LEAD, SUM OVER.
- Работа с датами: DATE_TRUNC, EXTRACT, INTERVAL.
- NULL-обработка: IS NULL, COALESCE, NULLIF.
- CASE WHEN.
Шпаргалки:
Продуктовые метрики
Обязательно:
- DAU, MAU, WAU + stickiness.
- Retention: D1, D7, D30, когортный.
- Воронка конверсии, drop-off.
- Unit-экономика: ARPU, ARPPU, LTV, CAC, payback.
- North Star metric, guardrails.
Без этого на собесе вас не возьмут, даже с крутым SQL.
Ресурсы:
Статистика
Минимум:
- p-value, α, β, мощность.
- Нормальное распределение, ЦПТ.
- Доверительные интервалы.
- Ошибки I и II рода.
- Корреляция vs причинность.
Ресурсы:
A/B-тесты
Обязательно:
- Дизайн эксперимента, MDE, размер выборки.
- Интерпретация результата: значим / не значим.
- Guardrail-метрики.
- Ошибки: peeking, SRM, multiple comparisons.
Ресурсы:
Tier 2 — сильно ускоряет трудоустройство
Python + pandas
Минимум:
- Базовый синтаксис: переменные, циклы, функции.
- Pandas: DataFrame, Series, groupby, merge.
- NumPy: базовые массивы.
- Matplotlib/seaborn: простые графики.
Шпаргалки:
BI-инструмент
Один из: Tableau, Power BI, Metabase, Superset, DataLens.
Что уметь:
- Подключить источник данных.
- Построить 5–7 базовых виджетов (линии, бары, pie, table).
- Calculated fields / meta-measures.
- Фильтры и дашборд для стейкхолдера.
Excel / Google Sheets
Уметь:
- VLOOKUP, INDEX/MATCH.
- Pivot tables.
- Формулы: IF, SUMIFS, COUNTIFS.
- Построение графиков.
Многие аналитики работают в Excel каждый день, даже имея SQL и BI.
Больше таких примеров с разборами — в Telegram-тренажёре. Короткие сессии, прогресс по темам, объяснения после каждого ответа.
Tier 3 — желательно, но не обязательно
Визуализация / data storytelling
- Принципы data viz.
- Когда какой график.
- Структура презентации результатов.
Git
Хотя бы базовое — clone, commit, push, pull. На работе вам нужно будет коммитить SQL-код в репозиторий.
Основы ML (для middle+)
- Линейная/логистическая регрессия.
- Decision Tree, Random Forest.
- Concept: train/test, overfitting.
Глубокое знание ML — это Data Scientist, не аналитик.
dbt, Airflow (для «DA + DE» ролей)
- dbt для трансформации данных.
- Airflow для ETL-оркестрации.
Если работаете в современном стеке — плюс.
Soft skills
Часто недооценивают. На middle+ они важнее технических.
Структурное мышление
Умение разложить кейс на части, задать правильные вопросы, выстроить логику ответа. На собесе именно это проверяют кейсами типа «метрика упала».
Коммуникация
- Объяснить сложное простыми словами.
- Написать краткое summary на 5 строк.
- Выступить на 5-минутной презентации дашборда.
Продуктовая интуиция
Понимать, зачем вы считаете метрику. Какие бизнес-решения от неё зависят. Что делать с результатом.
Работа с неоднозначностью
Аналитик часто получает кривые данные, противоречивые запросы, незаконченные постановки задач. Нужно уметь двигаться вперёд в тумане.
Что НЕ обязательно
Математический анализ
Интегралы и дифференциалы в аналитике не используются. Школьной алгебры достаточно.
Deep Learning
Нейросети — это Data Scientist. Для аналитика знать по верхам — ок, углубляться — не надо.
Продвинутый Python (классы, декораторы)
На junior-позиции. На middle+ — полезно, но не критично.
Hadoop
Устаревший, даже в больших компаниях заменяется на Spark и облачные стеки.
Если готовишься к собесу — бот @kariernik_bot закрывает 80% технических вопросов. SQL, Python, A/B, продуктовые метрики — всё в одном месте.
Приоритеты по времени
Если у вас 4 месяца, вложите время так:
- 30% — SQL. Это фундамент, с которым вас возьмут.
- 20% — продуктовые метрики. Без этого SQL бесполезен.
- 15% — статистика + A/B. Обязательная теория.
- 15% — Python + pandas. Для middle+.
- 10% — BI + визуализация. Дашборд в портфолио.
- 10% — soft skills + портфолио. Подготовка к собесам.
Читайте также
- Как стать аналитиком данных в 2026
- Roadmap аналитика данных
- План обучения
- Что делает аналитик данных
- Типы аналитиков
FAQ
Что важнее — SQL или Python?
SQL. 95% собеседований фокусируются на нём. Python — бонус для middle+.
Нужно ли ML?
Для аналитика — по верхам. Для DS — да, глубоко.
Какой BI-инструмент выбрать?
Любой из популярных (Tableau, Power BI, Metabase). Один, но хорошо. Переключиться на другой займёт 1–2 недели.
Как проверить, что я готов?
Пройдите 3–5 собеседований. Если проваливаете на SQL — учить SQL. На кейсах — учить продуктовые метрики. Обратная связь с собесов — лучший индикатор.