Как провести ad-hoc анализ
Что такое ad-hoc анализ
Ad-hoc analysis — это одноразовый анализ для конкретного бизнес-вопроса. В отличие от дашбордов и регулярных отчётов, ad-hoc делается редко и often в сжатые сроки.
Классический пример: «Какой сегмент пользователей принёс 80% выручки за прошлый квартал?» или «Почему retention D30 просел на iOS в марте?».
Для аналитика ad-hoc — 40-60% работы. Важный навык — делать это быстро и качественно.
Процесс от запроса до результата
Стандартный ad-hoc проходит через несколько этапов. Нарушить их — значит потерять время или дать неточный ответ.
Этап 1: Уточнение задачи (30 мин). Вам написали «посмотри retention». Это не задача. Что именно?
Этап 2: Получение данных (от часа до дня). SQL-запросы, сборка в pandas, клeaning.
Этап 3: Анализ (от часа до дня). Расчёты, визуализации, выводы.
Этап 4: Презентация (1-2 часа). Summary для stakeholder.
Для простых задач весь цикл — несколько часов. Для сложных — до недели.
Уточнение задачи
Первое, что нужно сделать — убедиться, что вы правильно поняли задачу. Основные вопросы:
Что именно спрашивают? «Посмотри retention» — это D1, D7, D30? Классический или unbounded?
Какой period? «Посмотри за март» — весь март, последние 30 дней, Q1?
Какой сегмент? Все пользователи, новые, платящие?
Для чего нужно? Для presentation CEO? Для PM-решения? Разный context — разный уровень детализации.
Какой deadline? Срочно сегодня или можно на следующей неделе?
Какой формат ответа? Одно число? Дашборд? Подробный deck?
Не бойтесь задавать эти вопросы. 5 минут уточнения экономят часы работы в wrong direction.
Разведка данных
Перед собственно анализом — посмотреть, какие данные у вас есть.
Откройте relevant таблицы, посмотрите:
- Колонки и типы.
- Количество строк.
- Значения в ключевых колонках (distinct values, распределения).
- NULL-ы.
- Диапазон дат.
- Аномалии.
Простые SELECT-ы типа:
SELECT * FROM orders LIMIT 10;
SELECT COUNT(*), MIN(created_at), MAX(created_at) FROM orders;
SELECT status, COUNT(*) FROM orders GROUP BY status;Эта разведка предотвращает ошибки позже. Например, вы узнаёте, что status = 'pending' — это 40% данных, и надо решить, включать или нет.
Если хочется сразу закрепить тему на практике — открой тренажёр в Telegram. 10 минут в день — и синтаксис в пальцах.
Структура анализа
Хороший ad-hoc имеет следующую структуру:
Big picture. Общие числа за период. Total users, total revenue, overall retention.
Сегментация. Разбивка по нескольким dimensions: platform, country, channel, cohort.
Тренд. Динамика во времени. Как менялось за период.
Сравнение. С предыдущим периодом, YoY, другой группой.
Глубина. Для выявленного pattern — копать глубже.
Hypothesis. Возможные причины observed patterns.
Не обязательно все элементы для каждой задачи. Но структура помогает не забыть важное.
Воспроизводимость
Ad-hoc часто воспринимается как throwaway. Не всегда.
Через 3 месяца кто-то может спросить: «Ты делал анализ retention в марте. Можешь повторить для апреля?».
Сохраните:
SQL-запросы. В git, с комментариями.
Jupyter notebook. С code + markdown пояснениями.
Выводы. Краткий summary для себя — почему такие числа получились.
Ad-hoc, который можно повторить — это уже полу-product. Time investment окупится.
Презентация результатов
Формат зависит от audience:
Для PM: Slack-сообщение с ключевыми числами и графиком. 5-10 минут.
Для Head of Product: короткая презентация (3-5 slides) с выводами и рекомендациями.
Для CEO: одна страница с TL;DR вверху и поддерживающими цифрами ниже.
Для аналитической команды: Jupyter notebook или dbt-model со всеми деталями.
Критично — подстроить формат под читателя. Senior не хотят читать 20 страниц, junior analyst может оценить методологию.
Подробнее про презентацию — в другой статье.
Управление временем
Ad-hoc могут разрастаться. Ставите целью 2 часа — уходит день.
Приёмы:
Time-boxing. «Этот анализ — максимум 4 часа. Если не успею, останавливаюсь и даю что есть».
Rough-first. Сначала грубый ответ. «Retention D30 примерно 25%, по предварительным данным». Потом уточнения.
Спросите, нужна ли точность. Часто PM достаточно «примерно». Не гонитесь за 0.1% accuracy для приближённых решений.
Не перфекционизм. 90% правильный ответ через день лучше 99% правильного через неделю.
Уровень детализации
Частая ошибка — слишком много деталей или слишком мало.
Слишком мало: «Retention упал». Это не вывод.
Слишком много: 30 графиков и 20 слайдов. Никто не прочитает.
Оптимум: 3-5 ключевых выводов, supporting графики, рекомендации.
Чтобы не только читать теорию, но и решать реальные задачи — загляните в бот Карьерника. Там по каждой теме подборка вопросов с разборами.
Validation
Перед отправкой — sanity check:
Круглые числа плохи. Если DAU ровно 100000, что-то не так. Реальные данные не круглые.
Проверьте totals. Сумма по сегментам = total? Если нет — проблема.
Cross-check с другими источниками. Ваш retention совпадает с retention в дашборде?
Покажите коллеге. Peer review ловит ошибки перед escalation.
Мелкая ошибка в ad-hoc для CEO может стоить доверия команды аналитики.
Часто задаваемые типы ad-hoc
«Почему метрика упала?» Диагностический анализ. Кейс.
«Какой сегмент наиболее profitable?» Сегментация + unit-экономика.
«Стоит ли запускать X?» Оценка через прокси-данные и разумные предположения.
«Сколько это принесёт денег?» Forecasting на основе текущих данных.
«Корреляция X и Y?» Базовый статистический анализ.
Каждый тип требует свой подход, но общая структура (уточнение → данные → анализ → презентация) одинакова.
Типичные ошибки
Начинать SQL-коду без уточнений. 3 часа работы в неверном направлении.
Answer the wrong question. Вас спросили про retention D30, вы показали D7.
Нет executive summary. Менеджер листает 10 страниц и не находит ответа на вопрос.
Презумпция знания context. «Retention упал на 5 п.п.» — у кого? По сравнению с чем? Поясняйте контекст.
Отсутствие recommendations. Факты без выводов — незавершённая работа.
Читайте также
FAQ
Сколько времени на ad-hoc?
От часов до недели. Обычно 1-2 дня.
Сохранять ли для будущего?
Всегда SQL и notebook в git. Это minimal effort с хорошим ROI.
Отказываться от unclear задач?
Не отказываться, а уточнять. «Я хочу правильно понять, давай уточним».
Как деprоритизировать?
Если 5 ad-hoc одновременно, обсудите с менеджером приоритеты. Не делайте сами в голове.