Как пройти тестовое задание аналитика данных

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Какие бывают тестовые задания

Тестовые в аналитике делятся на 4 типа:

  1. SQL — 5-15 задач, решить за 2-5 часов
  2. Python / pandas — анализ dataset-а в notebook, 4-8 часов
  3. Продуктовый кейс — анализ метрики, презентация инсайтов
  4. A/B-тестовое — анализ результатов эксперимента

Иногда — комбинация. Например, «SQL + продуктовый анализ + презентация».

Время: от 2-4 часов (несрочное) до 1-2 рабочих дней (большое).

SQL-тестовое

Что обычно дают

  • 5-15 задач разной сложности
  • Доступ к sandbox-БД (Postgres / ClickHouse) или dataset для локальной обработки
  • Время: 2-5 часов

Типы задач

  • Базовые JOIN-задачи (1-3 шт): фильтр, агрегаты по группам
  • Window functions (2-4 шт): top-K, running total, LAG
  • CTE и подзапросы (1-2 шт): многошаговая логика
  • Продуктовые (1-3 шт): retention, funnel, RFM

Как решать

  1. Прочитай ВСЕ задачи перед началом. Оцени сложность.
  2. Реши простые первыми — закрепи win-ы.
  3. Сложные — потом, с временем.
  4. Каждая задача: запрос + комментарий «что делаю» + результат.
  5. Объяснение: к каждому сложному запросу — 2-3 строки текста, почему именно так.

Сдача

Лучше всего:

  • GitHub Gist или репозиторий с .sql файлами
  • Или Notion / Confluence страница с запросами и объяснениями
  • Файл с описанием подхода и edge cases

Чего избегать: WhatsApp-сообщение с одним длинным запросом без объяснений.

Подробнее — SQL на собеседовании.

Python / pandas-тестовое

Что обычно дают

  • Dataset (CSV, parquet, или через API)
  • 3-7 вопросов: статы, визуализация, анализ
  • Можно ML basics (опционально)
  • Время: 4-8 часов

Структура notebook

1. EDA (Exploratory Data Analysis)
   - Shape, types, missing values
   - Распределения главных переменных
   - Outliers

2. Чистка и feature engineering
   - Handling missing, outliers
   - Новые признаки

3. Ответы на вопросы
   - Каждый вопрос — секция с кодом + текстовый ответ

4. Визуализация
   - matplotlib / seaborn / plotly
   - Подписи осей, заголовки

5. Выводы
   - Что главное узнал
   - Рекомендации (если уместно)

Подробнее — Python на собеседовании, pandas шпаргалка.

Продуктовый кейс

Что обычно дают

  • Описание продукта и проблемы
  • Метрика, которая «упала / выросла / неясна»
  • Вопрос: «как разобраться» или «что предложить»

Структура ответа

  1. Уточняющие вопросы (если есть кому задать) — что считаем, период, сегменты
  2. Декомпозиция проблемы на компоненты
  3. Гипотезы (3-5 штук, MECE)
  4. План проверки каждой гипотезы (как именно)
  5. Решения (если уместно)

Формат сдачи

  • PDF / slides с разбором
  • Или notebook с цифрами + текстовый разбор
  • Презентация на 5-10 минут

Подробнее — кейсы аналитика, кейс «метрика упала».

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

A/B-тестовое

Что обычно дают

  • Результат A/B-эксперимента: метрики T vs C
  • Вопрос: «значимо ли отличие, что делать»

Что нужно показать

  • Stat-test: t-test / z-test для пропорций
  • P-value, доверительный интервал, MDE
  • Power-анализ: достаточно ли выборки
  • Подводные камни: проверить SRM, novelty, peeking
  • Рекомендация: катить / не катить / собрать больше данных

Подробнее — A/B на собеседовании, размер выборки, SRM.

Структура отличного notebook

Великое тестовое отличается от среднего деталями. Что добавить:

1. Чёткий README / header

# Тестовое задание · Имя · Дата

## Задача
[Описание задачи в 2-3 строках]

## Подход
[Какие шаги — EDA → анализ → выводы]

## Главные находки
1. [Главная инсайт-1]
2. [Главная инсайт-2]

2. Комментарии в коде

Не «#TODO». А «# фильтруем по datetime, оставляя только active 30d пользователей».

3. Markdown-секции

Не «сплошная стена кода». Каждый блок — название + объяснение + код + результат.

4. Визуализация

Не «сырые plt.plot». Подписи осей, заголовок, легенда, размер.

5. Заключение

3-5 пунктов: что узнал, какие рекомендации, что бы делал дальше.

Частые ошибки

  • Решить «как можно быстрее». Тестовое не на скорость, а на качество. Лучше 1 чистая работа, чем 5 чёрновиков.
  • Без комментариев. Код без объяснений — рекрутеру непонятно.
  • Игнорировать EDA. Прыжки сразу к ответу без анализа данных — слабо.
  • Без визуализации. Текст без графиков — менее впечатляющ. Один-два хороших графика = огромный + .
  • Брать чужие решения. Пройдёт скрининг, провалится на собесе при углублении.
  • Не сдать в срок. Без объяснения опоздания — провал.
  • Сложный notebook без main thread. 50 cells, нет main story — рекрутер не понимает.

Связанные темы

FAQ

Сколько времени тратить на тестовое?

Зависит от компании. Малое тестовое — 2-4 часа. Большое — 1-2 рабочих дня. Не больше — иначе компания exploit ит твоё время.

Можно ли использовать ChatGPT?

Сложный вопрос. С одной стороны — современный analyst использует AI. С другой — на собесе спросят, как ты пришёл к решению.

Совет: использовать AI как помощника (gen draft SQL), но понимать каждую строку. Если не понимаешь — не сдавай.

Что если задача за пределами моих знаний?

Сделай что можешь. Объясни честно: «эту часть не успел / не знаю как». Это лучше, чем неправильное решение или копипаст из интернета.

Где сдавать тестовое?

GitHub (репо или Gist) — для технических. Notion / Google Docs — для продуктовых кейсов. Email — для финальной отправки.

Стоит ли делать «лишнее» (более глубокий анализ)?

Если время есть — да, но в меру. Покажи 1-2 «бонусных» инсайта. 10 не нужно.