Как выбрать тип графика на собеседовании

Почему выбор графика — ключевой навык

На собеседовании аналитика дают набор данных и спрашивают: «Как бы вы это визуализировали?». Правильный ответ — не конкретный график, а ход мысли: какой вопрос мы задаём данным и какой тип визуализации лучше всего на него ответит.

Аналитик, который сразу говорит «bar chart», не задавая уточняющих вопросов, показывает шаблонное мышление. Аналитик, который начинает с «зависит от того, что мы хотим показать» — демонстрирует зрелость.

Decision tree: четыре типа задач

Любую задачу визуализации можно свести к одной из четырёх целей. Это базовый фреймворк, который работает в 90% случаев.

Сравнение категорий — нужно показать разницу между группами. Выручка по регионам, конверсия по каналам, количество пользователей по сегментам. Основной инструмент — bar chart. Горизонтальный — если много категорий или длинные названия. Stacked bar — если нужно показать состав каждой категории.

Тренд во времени — нужно показать изменение по временной оси. DAU, выручка, retention по дням. Основной инструмент — line chart. Area chart — если нужно подчеркнуть объём. Несколько линий — если сравниваем тренды (но не больше 5-6).

Распределение — нужно показать, как значения рассредоточены. Зарплаты, возраст, время ответа. Основной инструмент — histogram для одной переменной, boxplot для сравнения распределений по группам. Violin plot — если важна форма распределения.

Связь между переменными — нужно показать зависимость. Расходы на рекламу и продажи, время на сайте и конверсия. Основной инструмент — scatter plot. Heatmap — для корреляционной матрицы между многими переменными.

На собеседовании задайте себе один вопрос: «Что я хочу показать — сравнение, тренд, распределение или связь?» Ответ определяет тип графика. Всё остальное — детали реализации.

Дополнительные сценарии

Доли целого — распределение бюджета, доли рынка. Pie chart при 3-5 категориях, stacked bar при большем количестве. Treemap — если есть иерархия (категория — подкатегория).

Географические данные — метрики по регионам, городам. Choropleth map (карта с заливкой) или bubble map. Но на собеседовании карты встречаются редко.

Поток и процесс — воронка конверсии, путь пользователя. Funnel chart или Sankey diagram. Важно показать, где происходят потери.

Многомерные данные — когда переменных больше двух. Scatter plot с цветом и размером (до 4 переменных), фасеты (small multiples), параллельные координаты.

Как отвечать на собеседовании

Шаг 1: Уточните цель. «Что мы хотим показать — сравнение, тренд, распределение?» Это сразу выделяет вас среди кандидатов.

Шаг 2: Определите тип данных. Категориальные или числовые? Временной ряд? Сколько переменных? Есть ли группировка?

Шаг 3: Назовите график и обоснуйте. «Line chart, потому что мы показываем динамику метрики во времени. Одна линия на сегмент, не более четырёх».

Шаг 4: Упомяните альтернативу. «Если сегментов больше пяти — использую фасеты вместо множества линий». Это показывает глубину понимания.

Типичные ошибки при выборе

Line chart для категорий без порядка — если на оси X регионы, линия подразумевает несуществующую непрерывность. Используйте bar chart.

Pie chart для сравнения — глаз плохо сравнивает углы. Bar chart показывает разницу точнее.

Scatter plot при 10 точках — слишком мало данных для выводов о связи. Таблица информативнее.

Один график для всего — попытка показать тренд, сравнение и распределение одновременно. Лучше три простых графика, чем один перегруженный.

Простое правило: если вы потратили 10 секунд на объяснение графика — он слишком сложный. Хорошая визуализация объясняет себя сама.

Как готовиться

Возьмите 10 разных датасетов и для каждого ответьте: цель визуализации, тип данных, выбор графика, обоснование. Доведите до автоматизма связку «цель — тип графика». Потренируйтесь объяснять выбор вслух — на собеседовании важна не только правильность, но и ясность рассуждения.

Подробнее о типах графиков — в разделе визуализация данных. Проверьте себя на примерах вопросов.

FAQ

Что делать, если ни один стандартный график не подходит?

Такое бывает редко. Сначала убедитесь, что задача чётко сформулирована. Если данные действительно сложные — комбинируйте: scatter plot + marginal histograms, фасеты с разными типами графиков. На собеседовании объясните логику выбора.

Как выбрать между histogram и boxplot?

Histogram — когда важна форма распределения (бимодальность, скос). Boxplot — когда важно сравнить группы и увидеть выбросы. Для одной переменной — histogram. Для сравнения 5+ групп — boxplot компактнее. Подробнее — в разделе подготовка к собеседованию.

Нужно ли знать редкие типы графиков (Sankey, radar, waterfall)?

Для junior — нет, достаточно базовых шести типов. Для middle+ — полезно знать, когда они уместны. Waterfall — для разложения изменения на компоненты. Sankey — для потоков. Radar — почти никогда не нужен на практике.