Чек-лист подготовки к собеседованию аналитика

Карьерник — Duolingo для аналитиков: 10 минут в день тренируй SQL, Python, A/B, статистику, метрики и ещё 3 темы собеса. 1500+ вопросов в Telegram-боте. Бесплатно.

Коротко

Это практичный чек-лист для тех, кто готовится к собеседованию на позицию аналитика данных. Не абстрактные советы, а конкретные действия: что делать за две недели, за неделю, за три дня и в день собеседования. Подходит для junior и middle позиций в продуктовых компаниях.

Чек-лист построен по принципу «от фундамента к деталям». Сначала закрываете хард-скиллы, потом кейсы, потом софт-скиллы. Не наоборот.

За 2 недели до собеседования

Этот этап — подготовка к подготовке. Не садитесь решать задачи, пока не сделаете разведку.

Изучите компанию:

  • Прочитайте описание вакансии — выпишите каждый упомянутый навык
  • Посмотрите продукт компании: скачайте приложение, потыкайте сайт, поймите бизнес-модель
  • Найдите в LinkedIn аналитиков из этой компании — их посты и статьи покажут реальный стек

Определите приоритеты:

  • Вакансия упоминает A/B-тесты? Ставьте их выше в плане
  • Нужен Python? Значит, будут задачи на Pandas
  • «Продуктовый аналитик» = много кейсов на метрики и декомпозицию

Оцените свой уровень:

  • Пройдите примеры вопросов по каждой теме — зафиксируйте, где пробелы
  • Составьте свой список слабых мест — именно на них уйдёт основное время

За 1 неделю: SQL

SQL спрашивают на каждом собеседовании аналитика. Слабый SQL = отказ, даже если всё остальное идеально.

Что тренировать:

  • JOIN: INNER, LEFT, RIGHT, FULL — разница между ними и подводные камни (NULL при LEFT JOIN)
  • Оконные функции: ROW_NUMBER, RANK, LAG/LEAD, SUM OVER — это спрашивают на каждом интервью
  • GROUP BY + HAVING — отличие от WHERE, агрегатные функции
  • Подзапросы и CTE — когда что использовать, вложенные подзапросы

Примеры вопросов, которые стоит прорешать:

  1. Найдите пользователей, которые совершили покупку в первый день после регистрации (JOIN + фильтрация по дате)
  2. Для каждого пользователя найдите разницу между текущей и предыдущей покупкой (LAG + оконная функция)
  3. Выведите топ-3 товара по выручке в каждой категории (ROW_NUMBER + PARTITION BY)
  4. Посчитайте retention D1, D7, D30 для когорты марта (GROUP BY + CASE WHEN + подзапрос)

Решайте задачи с таймером: одна SQL-задача = максимум 15 минут. На реальном собеседовании времени меньше.

Тренируйтесь на SQL-тренажёре — там задачи с вариантами ответов и разборами, отсортированные по сложности.

За 1 неделю: Python

Python-блок на собеседовании аналитика — это не алгоритмы и не ООП. Это работа с данными через Pandas.

Что тренировать:

  • Pandas: read_csv, фильтрация, groupby, merge, pivot_table
  • Обработка данных: пропуски (fillna, dropna), дубликаты (drop_duplicates), типы данных
  • Визуализация: matplotlib и seaborn — базовые графики, подписи осей, выбор типа графика
  • Разница между pandas-подходом и SQL-подходом к одной и той же задаче

Пример задачи:

import pandas as pd

df = pd.read_csv('orders.csv')
# Средний чек по месяцам
df['month'] = pd.to_datetime(df['created_at']).dt.to_period('M')
df.groupby('month')['amount'].mean()

Если Python — слабое место, сфокусируйтесь на Pandas и groupby. Это 80% вопросов.

За 1 неделю: Статистика и A/B-тесты

Для продуктовых аналитиков A/B-тесты — вторая по важности тема после SQL.

Статистика — минимум:

  • p-value: что это, чем НЕ является (это не вероятность гипотезы)
  • Доверительные интервалы: интерпретация, связь с размером выборки
  • Ошибки первого и второго рода — в контексте A/B-тестов
  • Нормальное распределение и центральная предельная теорема

A/B-тесты — обязательно:

  • Дизайн эксперимента: гипотеза, метрики, юнит рандомизации
  • Расчёт размера выборки: что влияет, почему нельзя остановить тест раньше
  • Типичные ловушки: peeking problem, novelty effect, сегментация по результатам
  • Что делать, если тест не показал значимость

Практикуйтесь на тренажёре A/B-тестов и тренажёре по статистике — там вопросы с подвохами, которые любят задавать на собеседованиях.

За 1 неделю: Продуктовая аналитика

Метрики, которые нужно знать наизусть:

  • Retention: D1, D7, D30, rolling retention — определения и SQL для расчёта
  • Воронки: конверсия между этапами, где теряются пользователи
  • Unit-экономика: LTV, CAC, ARPU, ARPPU — формулы и связь между ними
  • DAU/WAU/MAU — нюансы подсчёта, стикинесс

Кейсы на декомпозицию: Самый частый формат — вам дают метрику и просят разложить:

  • «Выручка = Пользователи x Конверсия x Средний чек x Частота»
  • «DAU = Новые + Вернувшиеся - Ушедшие»

Потренируйтесь раскладывать 5-6 метрик до третьего уровня вложенности. Подробнее — в тренажёре продуктовой аналитики.

За 3 дня: Продуктовые кейсы

Кейсы — это то, что отличает хорошего кандидата от отличного. Здесь нет правильного ответа, есть структура мышления.

Типовые кейсы:

  • «Метрика X упала на 20% — что проверяете?» Фреймворк: технические проблемы → сезонность → внешние факторы → изменения в продукте → сегментация
  • «Какую метрику выбрать для фичи Y?» Связка: бизнес-цель → целевая метрика → proxy-метрика → guardrail-метрики
  • «Как измерить эффект запуска Z?» Подход: A/B-тест, если возможно → до/после с поправкой → синтетический контроль

Фреймворк ответа на кейс:

  1. Уточните контекст (продукт, метрика, временной период)
  2. Сформулируйте гипотезы (3-5 штук)
  3. Предложите, как проверить каждую
  4. Приоритизируйте: начинайте с самых вероятных

За 1 день: Софт-скиллы

Метод STAR для поведенческих вопросов:

  • Situation — контекст и задача
  • Task — ваша роль
  • Action — что конкретно сделали
  • Result — результат в цифрах

Подготовьте 3-4 истории из опыта: сложный проект, конфликт с коллегой, ошибка и выводы, инициатива. Каждую историю расскажите вслух — это важно, письменная подготовка не заменяет устную.

Типичные поведенческие вопросы:

  • Расскажите о проекте, которым гордитесь
  • Был ли случай, когда данные противоречили интуиции?
  • Как вы объясняете сложные вещи нетехническим коллегам?

Вопросы для интервьюера (подготовьте 3-5):

  • Как устроена команда аналитики? Централизованная или распределённая?
  • Какой стек данных используете?
  • Какая задача сейчас самая приоритетная для аналитиков?

В день собеседования

  • Проверьте технику: камера, микрофон, интернет (если онлайн)
  • Откройте пустой текстовый редактор или SQL-песочницу — чтобы не искать в последний момент
  • Не повторяйте новый материал — пролистайте только заметки и шпаргалки
  • Поешьте за час до собеседования, выпейте воды
  • Если волнуетесь — это нормально. Лёгкий стресс улучшает концентрацию

Не пытайтесь казаться тем, кем не являетесь. Если чего-то не знаете — скажите честно и предложите, как бы вы это выяснили. Интервьюеры ценят честность больше, чем блеф.

Чек-лист

Разведка:

  • Изучил описание вакансии и выписал ключевые навыки
  • Посмотрел продукт компании
  • Оценил свои пробелы по каждой теме

SQL:

  • JOIN: INNER, LEFT, RIGHT, FULL — уверенно объясняю разницу
  • Оконные функции: ROW_NUMBER, RANK, LAG, LEAD, SUM OVER
  • GROUP BY, HAVING, подзапросы, CTE
  • Решил минимум 20 задач с таймером

Python:

  • Pandas: read_csv, фильтрация, groupby, merge, pivot_table
  • Обработка пропусков и дубликатов
  • Базовая визуализация в matplotlib/seaborn

Статистика и A/B:

  • p-value, доверительные интервалы, ошибки I/II рода
  • Дизайн A/B-теста: гипотеза, метрики, размер выборки
  • Знаю типичные ловушки: peeking, novelty effect

Продуктовая аналитика:

  • Retention, воронки, unit-экономика — определения и SQL
  • Декомпозиция метрик — практиковал на 5+ примерах
  • Продуктовые кейсы — отработал фреймворк ответа

Софт-скиллы:

  • 3-4 истории по STAR подготовлены и отрепетированы вслух
  • 3-5 вопросов для интервьюера готовы
  • Техника проверена

FAQ

Сколько времени нужно на подготовку к собеседованию аналитика?

Если есть базовые знания SQL и метрик — 2 недели достаточно, чтобы структурировать знания и закрыть пробелы. С нуля — заложите 4-6 недель. Главное — заниматься каждый день по 1-2 часа, а не 10 часов за день до интервью.

Что спрашивают на собеседовании аналитика данных чаще всего?

SQL — на каждом собеседовании (JOIN, оконные функции, GROUP BY). Продуктовые метрики и кейсы — на позициях продуктового аналитика. A/B-тесты — почти всегда для middle+. Python — зависит от компании, но тренд на обязательный Python растёт.

Нужно ли готовить портфолио для собеседования аналитика?

Для junior — портфолио на GitHub с 2-3 проектами (анализ датасета, дашборд, A/B-тест на открытых данных) заметно повышает шансы. Для middle+ — важнее опыт и умение рассказать о реальных проектах.

Как тренироваться решать SQL-задачи для собеседования?

Решайте задачи с таймером (15 минут на задачу), проговаривайте решение вслух. Используйте SQL-тренажёр для практики с вариантами ответов и разборами. Минимум — 20 задач за неделю, с акцентом на оконные функции и JOIN.