Вопросы по теме «Основы визуализации и выбор графика»
Когда использовать line chart, bar chart, scatter plot, heatmap — выбор типа графика определяет, насколько быстро читатель поймёт данные. На собеседовании дают датасет и просят выбрать подходящую визуализацию с обоснованием. Знание принципов Тафти, правило ink-to-data ratio и умение избегать chartjunk — признак зрелого аналитика.
Всего в этом разделе 20 вопросов. Каждый — с правильным ответом и кратким разбором теории. Разбито на 4 части по 5 вопросов.
Вопросы 1–5 из 20
1Нужно сравнить частоты 10 причин обращений в поддержку и быстро увидеть лидеров. Какой график выбрать?
A`line chart` по причинам, соединяя точки
BОтсортированный `bar chart` по убыванию частоты
C`histogram` по длине текста обращения
D`scatter plot` причина vs причина
Ответ: Ранжирование категорий проще всего читать в отсортированном `bar chart`.
Сортировка усиливает сравнение и помогает увидеть топ причин без лишнего поиска. `Line chart` подразумевает непрерывный порядок, которого у категорий нет.
2Что из перечисленного является типичным примером `chart junk`, который снижает читаемость?
AПодписи `axis` с единицами измерения
B3D-эффект, градиенты и тени на столбцах
CОграниченная палитра и один акцентный цвет для важного
DУмеренные сетки и видимый `baseline`
Ответ: `Chart junk` — это декоративные элементы, которые не несут данных и мешают чтению.
3D, тени и градиенты искажают восприятие и отвлекают от величин. Лучше оставить чистый `encoding` и минимальные элементы, которые помогают читать значения.
3Два сегмента имеют одинаковое среднее время сессии, но вы подозреваете, что у одного сегмента метрика бимодальная. Что лучше всего это покажет?
A`histogram` времени сессии по каждому сегменту
B`line chart` по порядку пользователей
C`table` только со средним и медианой
D`bar chart` с одним столбцом на сегмент
Ответ: Чтобы увидеть форму и «две вершины», нужен `histogram`, а не только среднее.
Бимодальность и хвосты часто не видны через агрегаты вроде среднего. `Histogram` раскрывает структуру распределения и помогает понять, почему одинаковые средние дают разный опыт.
4Вы хотите показать выручку по странам, но в данных каждая строка — отдельный заказ. Что нужно сделать перед построением `bar chart`?
AПостроить `scatter plot` по всем заказам: страна на `axis` X, выручка на `axis` Y
BПостроить `histogram` по значениям выручки, не учитывая страну
CСделать `aggregation` (например, сумма выручки) по стране и затем строить `bar chart`
DПостроить `line chart` по `order_id`, чтобы увидеть тренд
Ответ: Для сравнения стран нужен уровень `aggregation`, соответствующий вопросу.
`Bar chart` по странам предполагает по одной величине на категорию, поэтому сначала нужна `aggregation` заказов внутри страны. Иначе вы получите «миллион столбцов» или график, который не отвечает на вопрос.
5Нужно показать руководству 6 KPI с точными значениями (без акцента на тренде): выручка, маржа, конверсия, CAC, LTV, NPS. Что лучше?
A`table` с аккуратным форматированием чисел
B`bar chart` с 6 столбцами разных цветов
C`line chart` без оси времени
D`histogram` по значениям KPI
Ответ: Если важны точные значения и их мало, `table` часто лучше графика.
`Table` удобна для чтения точных чисел и сравнения нескольких показателей без визуальных искажений. График полезнее, когда нужно увидеть форму, динамику или структуру, а не просто значения.
Хотите тренировать интерактивно?
В приложении — таймер, прогресс, стрики и 1700+ вопросов по всем темам.
Тренировать в TelegramДругие темы: Визуализация данных