С чего начать изучение аналитики данных: первые 30 дней
Проблема первого шага
Вы решили стать аналитиком. Открываете интернет — там 50 курсов, 100 книг, 1000 ютуб-гайдов. Всё хочется пройти, ничего не хочется начинать. Классическая ловушка парализирует неделями.
Ниже — план первых 30 дней. Без воды, без курсов за 100k, без «сначала изучите математику».
Неделя 1: окружение и первый SQL
День 1: инструменты
Поставьте две вещи:
- PostgreSQL — https://postgresql.org/download.
- DBeaver — https://dbeaver.io/ (визуальный клиент, бесплатный).
Запустите, подключите DBeaver к PostgreSQL. На это уйдёт 30–60 минут.
Дни 2–3: первый запрос
Скачайте учебную базу данных (например, dvdrental — https://www.postgresqltutorial.com/postgresql-sample-database/).
Напишите первые запросы:
SELECT * FROM customer LIMIT 10;
SELECT first_name, last_name FROM customer WHERE active = 1;
SELECT first_name, last_name FROM customer ORDER BY last_name LIMIT 20;Поиграйте — посмотрите, что возвращается, как меняется результат при LIMIT, ORDER BY, WHERE.
Дни 4–5: фильтры и сортировка
WHERE x = y,WHERE x > y,WHERE x IN (...),WHERE x LIKE '%abc%'.AND,OR,NOT.ORDER BY ... DESC.DISTINCT.
Дни 6–7: первые агрегаты
COUNT(*),SUM,AVG,MIN,MAX.GROUP BY.HAVING.
К концу недели вы умеете: выбрать данные, отфильтровать, отсортировать, посчитать количество и сумму.
Неделя 2: JOIN и основы аналитики
Дни 8–10: JOIN
Без JOIN SQL бесполезен — все данные в разных таблицах.
- INNER JOIN — только совпадения.
- LEFT JOIN — все из левой + совпадения справа.
- Почему не надо использовать RIGHT JOIN.
- FULL OUTER JOIN (редко).
Практика: задачи на JOIN.
Шпаргалка: JOIN SQL.
Дни 11–12: работа с датами
DATE_TRUNC('month', col)— обрезать до начала месяца.EXTRACT(YEAR FROM col)— достать год.INTERVAL '7 day'— арифметика.
Шпаргалка: Даты в SQL.
Дни 13–14: что такое продуктовая аналитика
Прочитайте (не надо учить):
К концу недели вы понимаете, куда идёте.
Попробовать силы на подобных вопросах проще всего в тренажёре Карьерник — прямо в Telegram, без регистрации через сайт.
Неделя 3: оконные функции и подзапросы
Дни 15–17: оконные функции
Самый важный продвинутый блок SQL.
ROW_NUMBER() OVER (PARTITION BY x ORDER BY y).LAG(col) OVER (ORDER BY x)— предыдущее значение.SUM(col) OVER (PARTITION BY x)— агрегат по окну.
Практика: задачи на оконные.
Шпаргалка: Оконные функции.
Дни 18–19: подзапросы и CTE
- Подзапросы в WHERE:
WHERE x IN (SELECT ...). - Подзапросы в FROM:
FROM (SELECT ...) t. - CTE:
WITH x AS (SELECT ...) SELECT FROM x.
Шпаргалка: CTE, подзапросы.
Дни 20–21: retention и когорты
Практическая задача: посчитать D7-retention в SQL.
WITH cohort AS (
SELECT user_id FROM events WHERE event_time::DATE = '2026-04-01'
),
returned AS (
SELECT DISTINCT user_id FROM events WHERE event_time::DATE = '2026-04-08'
)
SELECT COUNT(*) * 1.0 / (SELECT COUNT(*) FROM cohort) AS retention
FROM cohort INTERSECT SELECT user_id FROM returned;Подробнее: как считать retention.
Неделя 4: A/B и портфолио
Дни 22–24: основы A/B-тестов
- Гипотеза, p-value, уровень значимости.
- Ошибки I и II рода, мощность.
- Размер выборки.
Шпаргалки: A/B-тесты.
Дни 25–27: первый проект в портфолио
Возьмите любой публичный датасет с Kaggle (например, e-commerce sales):
- Загрузите в PostgreSQL.
- Напишите 10 аналитических SQL-запросов.
- Опубликуйте на GitHub с README и выводами.
Дни 28–30: итоги и планирование
- Оцените, где слабо — возвращайтесь и закрывайте.
- Составьте план на следующие 60 дней (Python, статистика, BI).
- Начните мониторить вакансии — не подавайтесь ещё, просто смотрите требования.
Что НЕ делать в первые 30 дней
- Не покупать платный курс. Базу можно выучить бесплатно.
- Не читать книги 500+ страниц. Нужна практика, не теория.
- Не учить Python раньше SQL. SQL — база, без него Python бесполезен для аналитика.
- Не зубрить математику. Математика нужна в минимальном объёме (проценты, доли).
- Не сравнивать себя с экспертами. Они учатся 5+ лет. Дайте себе время.
Бесплатные ресурсы, которые реально работают
SQL
- SQL Academy — https://sql-academy.org.
- Stepik «Основы SQL» — https://stepik.org.
- Kaggle Learn SQL — https://kaggle.com/learn.
- Тренажёр Карьерник — задачи с реальных собеседований.
Статистика
- Khan Academy Statistics (англ.).
- Stepik «Основы статистики» Анатолия Карпова.
Python
- Kaggle Learn Python.
- Stepik «Поколение Python».
Продуктовая аналитика
- Блог GoPractice (бесплатные материалы).
- Kariernik blog — статьи по метрикам и продукту.
Пройти 30–50 задач по теме за вечер можно в Telegram-тренажёре. Это то, что отличает «знаю» от «уверенно отвечу на собесе».
Что важно понять до начала
- Скорость роста нелинейна. Первый месяц кажется, что ничего не получается. Через 2 месяца прорыв.
- Практика > теория. 1 решённая задача > 10 прочитанных статей.
- Сообщество спасает. Присоединяйтесь к Telegram-чатам аналитиков.
- Ошибки — норма. Забывать синтаксис, путать JOIN — это часть процесса.
Читайте также
- Как стать аналитиком данных в 2026
- Как стать аналитиком данных с нуля
- Roadmap аналитика данных
- Курсы vs самообучение
- Чеклист подготовки к собеседованию
FAQ
Сколько часов в день нужно заниматься?
Минимум 1 час в день с учётом практики. Оптимум — 2–3 часа. Полный день — если горит и есть возможность.
Что первое — SQL или Excel?
SQL. Excel знают все офисные люди, аналитик отличается SQL. Если вы уже в Excel — переход на SQL займёт недели.
Можно ли без программирования вообще?
Можно BI-аналитик — там больше BI-инструментов, меньше кода. Но для data-аналитика и продуктового — SQL обязателен.
Через сколько искать работу?
Через 2–3 месяца начните мониторить вакансии, через 4 — откликаться. Раньше — не имеет смысла, поздно — теряете темп.