Как аналитику использовать AI в работе
AI — инструмент аналитика, а не замена
В 2026 году ИИ для аналитика — это не угроза, а усилитель. ChatGPT, GitHub Copilot, Claude и другие LLM стали частью повседневного рабочего процесса. Но важно понимать: AI не заменяет мышление, он ускоряет рутину.
Аналитик по-прежнему формулирует вопросы, проверяет гипотезы и интерпретирует результаты. AI берёт на себя написание boilerplate-кода, первый черновик запроса и генерацию идей. Думать о продукте и бизнесе за вас он не умеет.
Если вы ещё не используете SQL и Python каждый день — начните с них. AI помогает тем, кто уже разбирается в основах, а не заменяет их.
Генерация SQL-запросов
Самый частый use case — написание SQL через промпт. Вы описываете задачу на естественном языке, AI выдаёт запрос.
Пример промпта:
Напиши SQL-запрос: посчитай retention day 1 для когорт по неделе регистрации. Таблицы: users (id, created_at), events (user_id, event_time, event_name). База — PostgreSQL.
AI выдаст рабочий запрос с CTE, DATE_TRUNC и JOIN. Но всегда проверяйте результат: AI может перепутать LEFT и INNER JOIN, забыть фильтр по дате или неправильно посчитать знаменатель.
Что работает хорошо:
- Генерация оконных функций (ROW_NUMBER, LAG, LEAD)
- Написание CTE-цепочек
- Перевод запроса из одного диалекта в другой (PostgreSQL → ClickHouse)
Что работает плохо:
- Сложная бизнес-логика (AI не знает ваши определения метрик)
- Оптимизация запросов под конкретную схему
Очистка и подготовка данных
Рутина, которую AI ускоряет в разы. Промпт вроде «напиши pandas-код для очистки этого датасета: убери дубликаты, заполни пропуски медианой, приведи даты к единому формату» — экономит 15–30 минут.
import pandas as pd
# Промпт: "Очисти датафрейм: удали дубли, заполни пропуски, парси даты"
df = pd.read_csv("data.csv")
df = df.drop_duplicates()
df["revenue"] = df["revenue"].fillna(df["revenue"].median())
df["date"] = pd.to_datetime(df["date"], format="mixed", dayfirst=True)
df = df.sort_values("date").reset_index(drop=True)AI также помогает с регулярными выражениями (regex), парсингом JSON из строковых полей и нормализацией категориальных переменных. Всё то, что занимает время не потому что сложно, а потому что рутинно.
Генерация гипотез и аналитических идей
Менее очевидный, но мощный способ использования AI — brainstorm. Опишите продукт, метрику и контекст, и попросите предложить гипотезы.
Пример промпта:
Конверсия из регистрации в первую покупку упала с 12% до 8% за последний месяц. Продукт — маркетплейс одежды, мобильное приложение. Предложи 10 гипотез, почему это могло произойти.
AI выдаст список: изменение в онбординге, сезонность, изменение в источниках трафика, технический баг, изменение ассортимента и т.д. Не все гипотезы будут релевантны, но 3–4 из 10 наведут на правильный путь.
Это особенно полезно для junior-аналитиков, которые ещё не развили «чуйку» на паттерны в данных.
AI для визуализации
AI помогает с кодом для графиков — особенно когда нужно что-то нестандартное в matplotlib или plotly.
Вместо 20 минут чтения документации:
Построй гистограмму с overlapping distributions для двух групп A/B-теста, полупрозрачную, с вертикальными линиями средних, подписями и легендой. Matplotlib.
AI выдаст готовый код. Также полезно: генерация дашбордов в Jupyter Notebook, подбор типа графика под задачу, форматирование осей и подписей.
Некоторые BI-инструменты уже встраивают AI напрямую — Tableau AI, Looker с Gemini, — но пока это скорее эксперимент, чем рабочий инструмент.
AI для документации и коммуникации
Аналитик тратит много времени на написание выводов, описание методологии, комментирование кода. AI ускоряет всё это:
- Описание результатов: «Объясни результаты A/B-теста нетехнической аудитории»
- Документирование SQL-запросов: «Добавь комментарии к каждому CTE в этом запросе»
- Письма и сообщения: «Напиши письмо продакту о результатах эксперимента — кратко, с рекомендацией»
Ограничения: галлюцинации и безопасность
AI в аналитике — не серебряная пуля. Есть два серьёзных ограничения:
Галлюцинации. AI уверенно генерирует неправильный SQL, некорректные формулы и выдуманные факты. Если вы не понимаете, что он написал — вы не сможете поймать ошибку. Поэтому знание SQL и Python по-прежнему обязательно.
Безопасность данных. Не вставляйте реальные данные пользователей в ChatGPT. Используйте синтетические данные или корпоративные решения (Azure OpenAI, self-hosted модели). Многие компании запрещают использование публичных LLM с рабочими данными.
Как говорить про AI на собеседовании
AI-навыки всё чаще упоминают в вакансиях. Но формулировка «использую ChatGPT» — слишком размытая. Лучше конкретно:
- «Использую AI для генерации SQL-черновиков и code review»
- «Автоматизирую data cleaning через промпты + ручную проверку»
- «Применяю Copilot в Jupyter для ускорения EDA»
Не преувеличивайте — интервьюер легко проверит, если попросит написать запрос без AI.
Вопросы с собеседований
— Как вы используете AI в работе аналитика? — Для генерации SQL-черновиков, очистки данных в pandas, brainstorm-а гипотез и документирования результатов. Всегда проверяю вывод вручную — AI галлюцинирует, особенно в бизнес-логике.
— Может ли AI заменить аналитика? — Нет. AI ускоряет написание кода и генерацию идей, но не понимает бизнес-контекст, не формулирует правильные вопросы и не несёт ответственность за решения. Аналитик — это мышление, а не набор SQL-запросов.
— Какие риски использования AI в аналитике? — Галлюцинации (некорректный код или выводы), утечка данных (если вставлять реальные данные в публичные LLM), ложная уверенность (когда AI звучит убедительно, но ошибается).
— Как проверить, что AI-сгенерированный SQL корректен? — Запустить на тестовых данных, проверить edge cases (NULL, пустые группы, дубликаты), сравнить результат с ручным подсчётом на маленькой выборке.
FAQ
Какие AI-инструменты используют аналитики данных в 2026 году?
ChatGPT и Claude — для генерации кода и анализа. GitHub Copilot — для автодополнения в IDE и Jupyter. Встроенные AI-функции в BI-инструментах (Tableau AI, Looker + Gemini). Специализированные решения: Text2SQL-модели, AI-ассистенты в dbt и Databricks.
Нужно ли учить Python и SQL, если есть AI?
Да. AI генерирует код, но вы должны понимать, что он делает, находить ошибки и адаптировать под свою задачу. Без знания основ вы не сможете оценить качество AI-вывода. AI — это множитель: 10x от нуля — всё ещё ноль.
Как безопасно использовать AI с рабочими данными?
Не вставляйте реальные данные пользователей в публичные LLM. Используйте корпоративные решения (Azure OpenAI, AWS Bedrock, self-hosted модели). Работайте с синтетическими или агрегированными данными. Уточните политику компании — многие явно запрещают использование ChatGPT с production-данными.
Потренируйте вопросы по аналитике данных — откройте тренажёр. 1500+ вопросов для собеседования аналитика. Бесплатно.