Основы визуализации и выбор графика: вопросы для собеседования (часть 2)

Когда использовать line chart, bar chart, scatter plot, heatmap — выбор типа графика определяет, насколько быстро читатель поймёт данные. На собеседовании дают датасет и просят выбрать подходящую визуализацию с обоснованием. Знание принципов Тафти, правило ink-to-data ratio и умение избегать chartjunk — признак зрелого аналитика.

Сравнения и ранжированиеДашборды и сторителлингРаспределения и выбросыЗависимости и scatter-графикиВременные ряды

Вопросы 610 из 20

6Нужно проверить связь между ценой заказа и вероятностью конверсии (две числовые переменные). Что выбрать?
A`bar chart` с ценой как категориями
B`line chart` соединяя заказы по порядку
C`histogram` по ценам
D`scatter plot` с ценой на `axis` X и конверсией на `axis` Y
Ответ: Связь двух числовых переменных лучше всего показывает `scatter plot`.

В `scatter plot` каждая точка — наблюдение, а `encoding` через две оси `axis` показывает корреляцию, кластеры и нелинейности. Линии и столбцы могут навязать ложный порядок и исказить вывод.

7Нужно показать динамику дневной выручки за 90 дней и увидеть тренд/сезонность. Что выбрать?
A`bar chart` с 90 столбцами без группировки
B`line chart` по дням
C`histogram` распределения выручки
D`scatter plot` без оси времени
Ответ: Динамику по времени обычно показывают `line chart`.

В `line chart` время естественно лежит на `axis` X, и линия хорошо показывает тренд и колебания. `Bar chart` с большим числом столбцов часто хуже читается и перегружает внимание.

8Нужно сравнить конверсию по 6 рекламным каналам за одну неделю. Какой тип графика наиболее уместен?
A`bar chart` с `baseline` от 0 и сортировкой категорий
B`line chart` по каналам, соединяя точки линией
C`histogram` по значениям конверсии
D`scatter plot` с каналами по обеим осям
Ответ: Для сравнения категорий подходит `bar chart` с нулевым `baseline`.

`Bar chart` лучше всего поддерживает сравнение величин между категориями. Нулевой `baseline` на `axis` Y сохраняет пропорции и не искажает разницу.

9Нужно понять распределение времени доставки (есть ли хвост и выбросы). Какой график лучше?
A`bar chart` по курьерам
B`line chart` по порядку заказов
C`histogram` с бинами по времени
D`scatter plot` без оси времени
Ответ: `Histogram` показывает форму распределения и хвосты.

`Histogram` строится через `aggregation` по бинам и помогает увидеть асимметрию и выбросы. Средние и временные линии часто скрывают структуру распределения.

10Вы строите `scatter plot`: на `axis` X число сессий, на `axis` Y выручка. Нужно дополнительно показать тариф (категория) и длительность сессии (число). Какой `encoding` наиболее удачен?
AЦвет = тариф (категория), размер точки = длительность (число)
BЦвет = длительность (число), размер точки = тариф (категория)
CДобавить третью ось и сделать 3D `scatter plot`
DЗаменить на `table` со всеми строками пользователей
Ответ: Категории удобно кодировать цветом, а непрерывную величину — размером или насыщенностью.

Так читателю проще различать группы и одновременно видеть градиент по числовому признаку. Перепутанный `encoding` (размер для категории) ухудшает сравнение и усложняет легенду.

1234

Хотите тренировать интерактивно?

В приложении — таймер, прогресс, стрики и 1700+ вопросов по всем темам.

Тренировать в Telegram

Другие темы: Визуализация данных

Сравнения и ранжированиеДашборды и сторителлингРаспределения и выбросыЗависимости и scatter-графикиВременные ряды