Основы визуализации и выбор графика: вопросы для собеседования (часть 3)
Когда использовать line chart, bar chart, scatter plot, heatmap — выбор типа графика определяет, насколько быстро читатель поймёт данные. На собеседовании дают датасет и просят выбрать подходящую визуализацию с обоснованием. Знание принципов Тафти, правило ink-to-data ratio и умение избегать chartjunk — признак зрелого аналитика.
Вопросы 11–15 из 20
11Есть события по минутам, но нужно показать общий тренд за квартал. Какой подход лучше?
AПостроить `bar chart` с одним столбцом на каждую минуту
BСделать `histogram` по времени события
CСделать `scatter plot` из всех минутных точек без агрегации
DСделать `aggregation` до дня/недели и построить `line chart` по агрегатам
Ответ: Для долгого периода чаще нужен тренд: помогает `aggregation` перед `line chart`.
Минутные данные дают шум и перегружают график, особенно на длинном горизонте. `Aggregation` до разумного шага (день/неделя) делает `line chart` читаемым и сопоставимым.
12Нужно сравнить распределение времени до первой покупки до и после изменения продукта. Что выбрать?
A`line chart` по пользователям в случайном порядке
B`bar chart` только по среднему времени до покупки
C`scatter plot` время до покупки vs дата регистрации без группировки
DДва `histogram` (или один с наложением) с одинаковыми бинами и одинаковой `axis`
Ответ: Для сравнения распределений используйте `histogram` с одинаковыми бинами и шкалой `axis`.
Среднее может скрыть сдвиги в хвостах и изменения формы распределения. Сопоставимые бины и одинаковая шкала делают сравнение честным и читаемым.
13В `bar chart` 25 категорий, и каждый столбец раскрашен уникальным ярким цветом. Какое улучшение наиболее корректно?
AОставить много цветов: так категории легче отличать
BСделать один нейтральный цвет и выделить 1–2 важные категории акцентом, чтобы `encoding` цветом не превращался в шум
CДобавить градиенты и тени, чтобы столбцы выглядели объёмнее
DПереехать на 3D, чтобы цвета были заметнее
Ответ: Слишком много цветов — это шум и `chart junk`; лучше один цвет и акцент.
Цвет — сильный `encoding`, и при десятках уникальных цветов он перестаёт помогать. Акцентирование нескольких важных категорий делает смысл яснее и улучшает читаемость.
14В `line chart` дневная конверсия колеблется в диапазоне 20–21%. Можно ли делать `baseline` не от 0, чтобы лучше видеть изменения?
AНельзя никогда: любая шкала должна начинаться с 0
BМожно всегда и без пояснений, главное чтобы линия была красивой
CМожно, если цель — сравнить изменения, диапазон явно показан на `axis` и читатель не перепутает масштаб
DМожно только если добавить 3D-эффект
Ответ: Для `line chart` не всегда нужен нулевой `baseline`, но важна честная шкала `axis`.
Линия чаще используется для динамики и сравнений изменений, поэтому допустим узкий диапазон, если он ясно подписан. Ошибка — скрыть масштаб так, что небольшие колебания выглядят как кратный рост.
15Нужно показать, из каких каналов складывается выручка в каждом регионе и каков общий объём по региону. Что уместнее?
AСложенный `bar chart` после `aggregation` выручки по региону и каналу
B`line chart` по регионам в алфавитном порядке
C`scatter plot` с регионом на обеих осях
D`histogram` выручки по всем заказам без разреза
Ответ: Для структуры внутри категории часто подходит сложенный `bar chart`.
Он показывает и общий объём (высота столбца), и вклад частей (сегменты внутри). Помните, что сравнивать сегменты между регионами по «середине» сложения сложнее, чем по общему `baseline`.
Хотите тренировать интерактивно?
В приложении — таймер, прогресс, стрики и 1700+ вопросов по всем темам.
Тренировать в TelegramДругие темы: Визуализация данных