Чек-лист подготовки к собеседованию аналитика
Карьерник — Duolingo для аналитиков: 10 минут в день тренируй SQL, Python, A/B, статистику, метрики и ещё 3 темы собеса. 1500+ вопросов в Telegram-боте. Бесплатно.
Коротко
Это практичный чек-лист для тех, кто готовится к собеседованию на позицию аналитика данных. Не абстрактные советы, а конкретные действия: что делать за две недели, за неделю, за три дня и в день собеседования. Подходит для junior и middle позиций в продуктовых компаниях.
Чек-лист построен по принципу «от фундамента к деталям». Сначала закрываете хард-скиллы, потом кейсы, потом софт-скиллы. Не наоборот.
За 2 недели до собеседования
Этот этап — подготовка к подготовке. Не садитесь решать задачи, пока не сделаете разведку.
Изучите компанию:
- Прочитайте описание вакансии — выпишите каждый упомянутый навык
- Посмотрите продукт компании: скачайте приложение, потыкайте сайт, поймите бизнес-модель
- Найдите в LinkedIn аналитиков из этой компании — их посты и статьи покажут реальный стек
Определите приоритеты:
- Вакансия упоминает A/B-тесты? Ставьте их выше в плане
- Нужен Python? Значит, будут задачи на Pandas
- «Продуктовый аналитик» = много кейсов на метрики и декомпозицию
Оцените свой уровень:
- Пройдите примеры вопросов по каждой теме — зафиксируйте, где пробелы
- Составьте свой список слабых мест — именно на них уйдёт основное время
За 1 неделю: SQL
SQL спрашивают на каждом собеседовании аналитика. Слабый SQL = отказ, даже если всё остальное идеально.
Что тренировать:
- JOIN: INNER, LEFT, RIGHT, FULL — разница между ними и подводные камни (NULL при LEFT JOIN)
- Оконные функции: ROW_NUMBER, RANK, LAG/LEAD, SUM OVER — это спрашивают на каждом интервью
- GROUP BY + HAVING — отличие от WHERE, агрегатные функции
- Подзапросы и CTE — когда что использовать, вложенные подзапросы
Примеры вопросов, которые стоит прорешать:
- Найдите пользователей, которые совершили покупку в первый день после регистрации (JOIN + фильтрация по дате)
- Для каждого пользователя найдите разницу между текущей и предыдущей покупкой (LAG + оконная функция)
- Выведите топ-3 товара по выручке в каждой категории (ROW_NUMBER + PARTITION BY)
- Посчитайте retention D1, D7, D30 для когорты марта (GROUP BY + CASE WHEN + подзапрос)
Решайте задачи с таймером: одна SQL-задача = максимум 15 минут. На реальном собеседовании времени меньше.
Тренируйтесь на SQL-тренажёре — там задачи с вариантами ответов и разборами, отсортированные по сложности.
За 1 неделю: Python
Python-блок на собеседовании аналитика — это не алгоритмы и не ООП. Это работа с данными через Pandas.
Что тренировать:
- Pandas: read_csv, фильтрация, groupby, merge, pivot_table
- Обработка данных: пропуски (fillna, dropna), дубликаты (drop_duplicates), типы данных
- Визуализация: matplotlib и seaborn — базовые графики, подписи осей, выбор типа графика
- Разница между pandas-подходом и SQL-подходом к одной и той же задаче
Пример задачи:
import pandas as pd
df = pd.read_csv('orders.csv')
# Средний чек по месяцам
df['month'] = pd.to_datetime(df['created_at']).dt.to_period('M')
df.groupby('month')['amount'].mean()Если Python — слабое место, сфокусируйтесь на Pandas и groupby. Это 80% вопросов.
За 1 неделю: Статистика и A/B-тесты
Для продуктовых аналитиков A/B-тесты — вторая по важности тема после SQL.
Статистика — минимум:
- p-value: что это, чем НЕ является (это не вероятность гипотезы)
- Доверительные интервалы: интерпретация, связь с размером выборки
- Ошибки первого и второго рода — в контексте A/B-тестов
- Нормальное распределение и центральная предельная теорема
A/B-тесты — обязательно:
- Дизайн эксперимента: гипотеза, метрики, юнит рандомизации
- Расчёт размера выборки: что влияет, почему нельзя остановить тест раньше
- Типичные ловушки: peeking problem, novelty effect, сегментация по результатам
- Что делать, если тест не показал значимость
Практикуйтесь на тренажёре A/B-тестов и тренажёре по статистике — там вопросы с подвохами, которые любят задавать на собеседованиях.
За 1 неделю: Продуктовая аналитика
Метрики, которые нужно знать наизусть:
- Retention: D1, D7, D30, rolling retention — определения и SQL для расчёта
- Воронки: конверсия между этапами, где теряются пользователи
- Unit-экономика: LTV, CAC, ARPU, ARPPU — формулы и связь между ними
- DAU/WAU/MAU — нюансы подсчёта, стикинесс
Кейсы на декомпозицию: Самый частый формат — вам дают метрику и просят разложить:
- «Выручка = Пользователи x Конверсия x Средний чек x Частота»
- «DAU = Новые + Вернувшиеся - Ушедшие»
Потренируйтесь раскладывать 5-6 метрик до третьего уровня вложенности. Подробнее — в тренажёре продуктовой аналитики.
За 3 дня: Продуктовые кейсы
Кейсы — это то, что отличает хорошего кандидата от отличного. Здесь нет правильного ответа, есть структура мышления.
Типовые кейсы:
- «Метрика X упала на 20% — что проверяете?» Фреймворк: технические проблемы → сезонность → внешние факторы → изменения в продукте → сегментация
- «Какую метрику выбрать для фичи Y?» Связка: бизнес-цель → целевая метрика → proxy-метрика → guardrail-метрики
- «Как измерить эффект запуска Z?» Подход: A/B-тест, если возможно → до/после с поправкой → синтетический контроль
Фреймворк ответа на кейс:
- Уточните контекст (продукт, метрика, временной период)
- Сформулируйте гипотезы (3-5 штук)
- Предложите, как проверить каждую
- Приоритизируйте: начинайте с самых вероятных
За 1 день: Софт-скиллы
Метод STAR для поведенческих вопросов:
- Situation — контекст и задача
- Task — ваша роль
- Action — что конкретно сделали
- Result — результат в цифрах
Подготовьте 3-4 истории из опыта: сложный проект, конфликт с коллегой, ошибка и выводы, инициатива. Каждую историю расскажите вслух — это важно, письменная подготовка не заменяет устную.
Типичные поведенческие вопросы:
- Расскажите о проекте, которым гордитесь
- Был ли случай, когда данные противоречили интуиции?
- Как вы объясняете сложные вещи нетехническим коллегам?
Вопросы для интервьюера (подготовьте 3-5):
- Как устроена команда аналитики? Централизованная или распределённая?
- Какой стек данных используете?
- Какая задача сейчас самая приоритетная для аналитиков?
В день собеседования
- Проверьте технику: камера, микрофон, интернет (если онлайн)
- Откройте пустой текстовый редактор или SQL-песочницу — чтобы не искать в последний момент
- Не повторяйте новый материал — пролистайте только заметки и шпаргалки
- Поешьте за час до собеседования, выпейте воды
- Если волнуетесь — это нормально. Лёгкий стресс улучшает концентрацию
Не пытайтесь казаться тем, кем не являетесь. Если чего-то не знаете — скажите честно и предложите, как бы вы это выяснили. Интервьюеры ценят честность больше, чем блеф.
Чек-лист
Разведка:
- Изучил описание вакансии и выписал ключевые навыки
- Посмотрел продукт компании
- Оценил свои пробелы по каждой теме
SQL:
- JOIN: INNER, LEFT, RIGHT, FULL — уверенно объясняю разницу
- Оконные функции: ROW_NUMBER, RANK, LAG, LEAD, SUM OVER
- GROUP BY, HAVING, подзапросы, CTE
- Решил минимум 20 задач с таймером
Python:
- Pandas: read_csv, фильтрация, groupby, merge, pivot_table
- Обработка пропусков и дубликатов
- Базовая визуализация в matplotlib/seaborn
Статистика и A/B:
- p-value, доверительные интервалы, ошибки I/II рода
- Дизайн A/B-теста: гипотеза, метрики, размер выборки
- Знаю типичные ловушки: peeking, novelty effect
Продуктовая аналитика:
- Retention, воронки, unit-экономика — определения и SQL
- Декомпозиция метрик — практиковал на 5+ примерах
- Продуктовые кейсы — отработал фреймворк ответа
Софт-скиллы:
- 3-4 истории по STAR подготовлены и отрепетированы вслух
- 3-5 вопросов для интервьюера готовы
- Техника проверена
FAQ
Сколько времени нужно на подготовку к собеседованию аналитика?
Если есть базовые знания SQL и метрик — 2 недели достаточно, чтобы структурировать знания и закрыть пробелы. С нуля — заложите 4-6 недель. Главное — заниматься каждый день по 1-2 часа, а не 10 часов за день до интервью.
Что спрашивают на собеседовании аналитика данных чаще всего?
SQL — на каждом собеседовании (JOIN, оконные функции, GROUP BY). Продуктовые метрики и кейсы — на позициях продуктового аналитика. A/B-тесты — почти всегда для middle+. Python — зависит от компании, но тренд на обязательный Python растёт.
Нужно ли готовить портфолио для собеседования аналитика?
Для junior — портфолио на GitHub с 2-3 проектами (анализ датасета, дашборд, A/B-тест на открытых данных) заметно повышает шансы. Для middle+ — важнее опыт и умение рассказать о реальных проектах.
Как тренироваться решать SQL-задачи для собеседования?
Решайте задачи с таймером (15 минут на задачу), проговаривайте решение вслух. Используйте SQL-тренажёр для практики с вариантами ответов и разборами. Минимум — 20 задач за неделю, с акцентом на оконные функции и JOIN.