Как пройти тестовое задание аналитика данных
Содержание:
Какие бывают тестовые задания
Тестовые в аналитике делятся на 4 типа:
- SQL — 5-15 задач, решить за 2-5 часов
- Python / pandas — анализ dataset-а в notebook, 4-8 часов
- Продуктовый кейс — анализ метрики, презентация инсайтов
- A/B-тестовое — анализ результатов эксперимента
Иногда — комбинация. Например, «SQL + продуктовый анализ + презентация».
Время: от 2-4 часов (несрочное) до 1-2 рабочих дней (большое).
SQL-тестовое
Что обычно дают
- 5-15 задач разной сложности
- Доступ к sandbox-БД (Postgres / ClickHouse) или dataset для локальной обработки
- Время: 2-5 часов
Типы задач
- Базовые JOIN-задачи (1-3 шт): фильтр, агрегаты по группам
- Window functions (2-4 шт): top-K, running total, LAG
- CTE и подзапросы (1-2 шт): многошаговая логика
- Продуктовые (1-3 шт): retention, funnel, RFM
Как решать
- Прочитай ВСЕ задачи перед началом. Оцени сложность.
- Реши простые первыми — закрепи win-ы.
- Сложные — потом, с временем.
- Каждая задача: запрос + комментарий «что делаю» + результат.
- Объяснение: к каждому сложному запросу — 2-3 строки текста, почему именно так.
Сдача
Лучше всего:
- GitHub Gist или репозиторий с
.sqlфайлами - Или Notion / Confluence страница с запросами и объяснениями
- Файл с описанием подхода и edge cases
Чего избегать: WhatsApp-сообщение с одним длинным запросом без объяснений.
Подробнее — SQL на собеседовании.
Python / pandas-тестовое
Что обычно дают
- Dataset (CSV, parquet, или через API)
- 3-7 вопросов: статы, визуализация, анализ
- Можно ML basics (опционально)
- Время: 4-8 часов
Структура notebook
1. EDA (Exploratory Data Analysis)
- Shape, types, missing values
- Распределения главных переменных
- Outliers
2. Чистка и feature engineering
- Handling missing, outliers
- Новые признаки
3. Ответы на вопросы
- Каждый вопрос — секция с кодом + текстовый ответ
4. Визуализация
- matplotlib / seaborn / plotly
- Подписи осей, заголовки
5. Выводы
- Что главное узнал
- Рекомендации (если уместно)Подробнее — Python на собеседовании, pandas шпаргалка.
Продуктовый кейс
Что обычно дают
- Описание продукта и проблемы
- Метрика, которая «упала / выросла / неясна»
- Вопрос: «как разобраться» или «что предложить»
Структура ответа
- Уточняющие вопросы (если есть кому задать) — что считаем, период, сегменты
- Декомпозиция проблемы на компоненты
- Гипотезы (3-5 штук, MECE)
- План проверки каждой гипотезы (как именно)
- Решения (если уместно)
Формат сдачи
- PDF / slides с разбором
- Или notebook с цифрами + текстовый разбор
- Презентация на 5-10 минут
Подробнее — кейсы аналитика, кейс «метрика упала».
A/B-тестовое
Что обычно дают
- Результат A/B-эксперимента: метрики T vs C
- Вопрос: «значимо ли отличие, что делать»
Что нужно показать
- Stat-test: t-test / z-test для пропорций
- P-value, доверительный интервал, MDE
- Power-анализ: достаточно ли выборки
- Подводные камни: проверить SRM, novelty, peeking
- Рекомендация: катить / не катить / собрать больше данных
Подробнее — A/B на собеседовании, размер выборки, SRM.
Структура отличного notebook
Великое тестовое отличается от среднего деталями. Что добавить:
1. Чёткий README / header
# Тестовое задание · Имя · Дата
## Задача
[Описание задачи в 2-3 строках]
## Подход
[Какие шаги — EDA → анализ → выводы]
## Главные находки
1. [Главная инсайт-1]
2. [Главная инсайт-2]2. Комментарии в коде
Не «#TODO». А «# фильтруем по datetime, оставляя только active 30d пользователей».
3. Markdown-секции
Не «сплошная стена кода». Каждый блок — название + объяснение + код + результат.
4. Визуализация
Не «сырые plt.plot». Подписи осей, заголовок, легенда, размер.
5. Заключение
3-5 пунктов: что узнал, какие рекомендации, что бы делал дальше.
Частые ошибки
- Решить «как можно быстрее». Тестовое не на скорость, а на качество. Лучше 1 чистая работа, чем 5 чёрновиков.
- Без комментариев. Код без объяснений — рекрутеру непонятно.
- Игнорировать EDA. Прыжки сразу к ответу без анализа данных — слабо.
- Без визуализации. Текст без графиков — менее впечатляющ. Один-два хороших графика = огромный + .
- Брать чужие решения. Пройдёт скрининг, провалится на собесе при углублении.
- Не сдать в срок. Без объяснения опоздания — провал.
- Сложный notebook без main thread. 50 cells, нет main story — рекрутер не понимает.
Связанные темы
- Подготовка к собесу аналитика
- SQL на собеседовании
- Python на собеседовании
- Кейсы на собесе аналитика
- Тестовое задание аналитика — обзор
FAQ
Сколько времени тратить на тестовое?
Зависит от компании. Малое тестовое — 2-4 часа. Большое — 1-2 рабочих дня. Не больше — иначе компания exploit ит твоё время.
Можно ли использовать ChatGPT?
Сложный вопрос. С одной стороны — современный analyst использует AI. С другой — на собесе спросят, как ты пришёл к решению.
Совет: использовать AI как помощника (gen draft SQL), но понимать каждую строку. Если не понимаешь — не сдавай.
Что если задача за пределами моих знаний?
Сделай что можешь. Объясни честно: «эту часть не успел / не знаю как». Это лучше, чем неправильное решение или копипаст из интернета.
Где сдавать тестовое?
GitHub (репо или Gist) — для технических. Notion / Google Docs — для продуктовых кейсов. Email — для финальной отправки.
Стоит ли делать «лишнее» (более глубокий анализ)?
Если время есть — да, но в меру. Покажи 1-2 «бонусных» инсайта. 10 не нужно.