Типы графиков на собеседовании аналитика

Почему типы графиков спрашивают на собеседовании

Умение выбрать правильный тип графика показывает, как аналитик думает о данных. Интервьюер описывает задачу и ожидает обоснованный выбор визуализации. Ответ «я бы построил график» без уточнения типа — сигнал о поверхностном понимании.

На практике аналитик ежедневно принимает десятки решений о визуализации: для дашбордов, презентаций, исследований. Неправильный график искажает восприятие данных и приводит к ошибочным выводам.

Основные типы графиков

Bar chart (столбчатая диаграмма) — сравнение категорий. Выручка по регионам, количество пользователей по каналам привлечения, конверсия по сегментам. При более чем 8 категориях лучше использовать горизонтальный bar chart — подписи читаются удобнее.

Line chart (линейный график) — динамика во времени. DAU по дням, выручка по месяцам, retention по когортам. Ключевое свойство — непрерывность оси X. Линейный график для категориальных данных без порядка — ошибка, которую замечают интервьюеры.

Scatter plot (диаграмма рассеяния) — зависимость между двумя числовыми переменными. Корреляция расходов на рекламу и продаж, связь времени на сайте и конверсии. Можно добавить третью переменную через размер точки или цвет.

Pie chart (круговая диаграмма) — доли целого. Распределение трафика по каналам, доля каждого продукта в выручке. Работает только при 3-5 категориях и заметной разнице между долями. Для большего числа категорий bar chart информативнее.

Histogram (гистограмма) — распределение одной числовой переменной. Распределение зарплат, возраст пользователей, время ответа сервиса. Число бинов влияет на интерпретацию — слишком мало скроют детали, слишком много создадут шум.

Boxplot (ящик с усами) — распределение по группам с выбросами. Зарплаты по отделам, время доставки по городам. Показывает медиану, квартили и выбросы — компактнее гистограммы при сравнении нескольких групп.

Интервьюер оценивает не знание названий, а способность объяснить почему конкретный график подходит для конкретной задачи. «Bar chart, потому что сравниваем категории» — хороший ответ. «Bar chart» без пояснения — слабый.

Типичные вопросы на собеседовании

Вопрос 1: «Как визуализировать retention по когортам?» Ответ — heatmap или набор линий (line chart). Heatmap удобнее при большом количестве когорт, линии — когда нужно сравнить 3-5 когорт.

Вопрос 2: «Почему pie chart — плохой выбор для 10 категорий?» Человеческий глаз плохо сравнивает углы и площади. При 10+ категориях доли визуально неразличимы. Bar chart решает эту задачу точнее.

Вопрос 3: «В чём разница между histogram и bar chart?» Histogram — для непрерывных данных (бины), bar chart — для категориальных. У histogram нет промежутков между столбцами, у bar chart есть.

Вопрос 4: «Когда scatter plot бесполезен?» Когда точек слишком много и они сливаются в пятно. Решение — прозрачность (alpha), hexbin или 2D-гистограмма.

На собеседовании могут показать датасет и попросить предложить визуализацию. Начинайте с вопроса: «Что мы хотим показать — сравнение, тренд, распределение или связь?»

Как готовиться

Запомните четыре базовых сценария: сравнение категорий — bar, динамика во времени — line, распределение — histogram/boxplot, связь двух переменных — scatter. Всё остальное — вариации этих четырёх.

Потренируйтесь на реальных датасетах: возьмите таблицу и для каждой задачи обоснуйте выбор графика. Подробнее о выборе визуализации и подготовке к собеседованию.

FAQ

Какие типы графиков спрашивают чаще всего?

Bar chart, line chart, scatter plot и histogram — четвёрка, которую нужно знать любому аналитику. Boxplot и heatmap встречаются реже, но на middle+ позициях их тоже спрашивают. Проверьте себя на примерах вопросов.

Нужно ли знать экзотические графики (violin, treemap, sankey)?

Для junior-позиций — нет. Для middle и senior — полезно знать, когда они уместны, но подробности реализации обычно не спрашивают. Главное — уметь объяснить, почему стандартный график не подходит и чем его заменить.

Как быстро выбрать тип графика на собеседовании?

Задайте себе вопрос: «Что я хочу показать?» Сравнение — bar. Тренд — line. Распределение — histogram. Связь — scatter. Доли — pie (до 5 категорий). Этот алгоритм покрывает 90% задач. Подробнее — в разделе визуализация данных.