Ошибки визуализации на собеседовании аналитика

Зачем спрашивают ошибки визуализации

Интервьюеры часто показывают «плохой» график и просят найти проблемы. Это проверяет критическое мышление — аналитик должен замечать искажения в данных, а не только строить графики. В реальной работе ошибочная визуализация может привести к неверным решениям на уровне всей компании.

Формат вопроса: «Что не так с этим графиком?» или «Как вы бы улучшили эту визуализацию?». Иногда дают несколько графиков и просят выбрать лучший.

Обрезанная ось Y

Самая распространённая ошибка — ось Y начинается не с нуля. Bar chart с осью от 95 до 100 визуально превращает разницу в 2% в огромный разрыв. Зритель видит столбец в 5 раз выше другого, хотя реальная разница минимальна.

Когда обрезка оправдана: на line chart при анализе трендов — если значения колеблются от 98 до 102, полная ось от нуля скроет динамику. Ключевое правило: для bar chart ось всегда от нуля, для line chart — зависит от контекста.

На собеседовании покажите, что вы понимаете разницу между контекстами. Не говорите «ось всегда должна начинаться с нуля» — это упрощение.

3D-графики

3D-графики почти всегда ухудшают восприятие. Трёхмерная перспектива искажает пропорции: передние элементы кажутся больше задних, сравнивать высоту столбцов или размер секторов становится невозможно.

Единственное исключение — когда данные действительно трёхмерные (поверхности, скан-данные). Для стандартной аналитики 2D с цветовым кодированием всегда информативнее.

На собеседовании ответ «3D-графики вредят восприятию» — сильный сигнал. Но подкрепите его примером: «Перспектива искажает пропорции, и зритель не может точно сравнить значения».

Pie chart с большим числом категорий

Pie chart работает при 3-5 категориях с заметной разницей долей. При 10+ категориях сектора сливаются, мелкие доли неразличимы. Человеческий глаз плохо сравнивает углы — это ограничение восприятия, а не вкусовщина.

Типичная ошибка: pie chart для распределения пользователей по 15 регионам. Решение — горизонтальный bar chart с сортировкой по убыванию. Интервьюер ожидает именно это предложение.

Ещё хуже: nested pie chart (пончик в пончике) — добавляет второй уровень неразличимых секторов.

Двойные оси

График с двумя осями Y (слева и справа) — опасный инструмент. Две шкалы с разным масштабом создают ложное впечатление о связи между переменными. Линия выручки «следует» за линией числа пользователей просто потому, что масштабы подобраны подходящим образом.

Альтернатива: два отдельных графика с общей осью X (фасеты). Или нормализация данных к одной шкале (индекс, процент от базового значения).

На собеседовании скажите: «Двойные оси создают ложную корреляцию. Лучше использовать фасеты или нормализацию».

Другие частые ошибки

Отсутствие подписей осей и заголовка — график без контекста бесполезен. Зритель не должен гадать, что изображено.

Слишком много линий — более 5-6 линий на одном графике превращают визуализацию в неразбериху. Решение — фасеты (small multiples) или выделение 2-3 ключевых линий с приглушением остальных.

Неправильный масштаб — логарифмический масштаб без указания скрывает порядковые различия. Линейный масштаб при данных с разбросом в 1000 раз скрывает мелкие значения.

Радужная цветовая палитра — выглядит ярко, но не несёт информации. Для последовательных данных нужна последовательная палитра, для категорий — дискретная.

Когда интервьюер показывает «плохой» график, начните с главной проблемы, затем перечислите второстепенные. Не останавливайтесь на одной ошибке — их обычно несколько.

Как готовиться

Просматривайте примеры плохих визуализаций (раздел r/dataisugly — хороший источник) и тренируйтесь находить ошибки за 30 секунд. Для каждой ошибки формулируйте конкретное решение, а не просто «это плохо».

Подробнее о выборе правильного графика — в разделе визуализация данных. Практикуйтесь на примерах вопросов.

FAQ

Какая ошибка визуализации встречается на собеседованиях чаще всего?

Обрезанная ось Y на bar chart. Интервьюеры любят эту задачу, потому что она простая, но многие кандидаты не замечают проблему сразу. Запомните правило: bar chart — ось от нуля, line chart — зависит от контекста.

Можно ли использовать pie chart на собеседовании?

Можно, но только для 3-5 категорий с существенной разницей долей. Если интервьюер спрашивает «какой график для долей?» — ответьте «pie chart при малом числе категорий, иначе stacked bar или обычный bar chart».

Как объяснить интервьюеру проблему двойных осей?

Скажите, что две шкалы с разным масштабом позволяют создать иллюзию любой зависимости. Подбирая масштаб, можно заставить любые две линии двигаться синхронно. Решение — фасеты. Смотрите также подготовку к собеседованию аналитика.