Основы визуализации и выбор графика: вопросы для собеседования (часть 4)
Когда использовать line chart, bar chart, scatter plot, heatmap — выбор типа графика определяет, насколько быстро читатель поймёт данные. На собеседовании дают датасет и просят выбрать подходящую визуализацию с обоснованием. Знание принципов Тафти, правило ink-to-data ratio и умение избегать chartjunk — признак зрелого аналитика.
Вопросы 16–20 из 20
16Нужно показать связь между временем на сайте и суммой заказа, но точек миллионы и `scatter plot` превращается в сплошное пятно. Что лучше сделать?
AОставить `scatter plot` как есть, миллионы точек только повышают точность
BПоказать `table` со всеми миллионами строк
CСделать `aggregation` в бины и показать плотность как 2D `histogram` (вместо рисования каждой точки)
DПостроить `line chart`, соединяя точки в случайном порядке
Ответ: При переуплотнении помогает `aggregation` в бины и показ плотности вместо каждой точки.
2D `histogram` сохраняет информацию о концентрации и форме связи, но остаётся читаемым. Иначе `encoding` «точка = наблюдение» перестаёт работать, потому что точки перекрываются.
17В `bar chart` средний чек по сегментам показали с `baseline` на `axis` Y от 900 до 1100, и разница выглядит огромной. Как исправить, чтобы не исказить сравнение?
AОставить как есть, так «нагляднее»
BНачать `axis` Y от 0 (или явно показать разрыв шкалы отдельно) и честно подписать диапазон
CСделать столбцы 3D, чтобы объём выглядел убедительнее
DУбрать подписи осей, чтобы не отвлекать
Ответ: Для `bar chart` нулевой `baseline` критичен, иначе сравнение искажается.
Длина столбца кодирует величину, поэтому обрезанный `baseline` на `axis` Y визуально преувеличивает различия. Если нужен зум, лучше сделать отдельный график или явную «сломленную» шкалу, а не скрывать масштаб.
18На одном графике показали выручку и конверсию двумя линиями с двумя разными `axis` Y, и визуально они «идеально коррелируют». Что корректнее сделать, чтобы не вводить в заблуждение?
AОставить двойную `axis`, она экономит место и всегда честная
BСделать 3D `line chart`, так связь будет ещё заметнее
CРазнести метрики на два графика или нормализовать их на одной шкале и явно объяснить `encoding`
DЗаменить всё на `table` и не использовать графики вовсе
Ответ: Двойная `axis` легко создаёт ложную корреляцию; лучше разнести или нормализовать.
При двух шкалах визуальная форма линий зависит от выбора диапазонов, и её можно «подогнать» почти под что угодно. Отдельные графики или единая нормированная шкала делают сравнение честнее и прозрачнее для читателя.
19В презентации предлагают заменить `bar chart` долей категорий на 3D круговую диаграмму, потому что она «красивее». Какой аргумент наиболее корректен?
A3D всегда точнее, потому что добавляет глубину
BНужно добавить ещё больше цветов, тогда 3D будет понятнее
CЕсли убрать `baseline`, 3D будет честнее
D3D добавляет `chart junk` и искажает `encoding` площади/угла; лучше оставить 2D график (например, `bar chart`) для точного сравнения
Ответ: 3D — это `chart junk`: он искажает восприятие и мешает точному сравнению.
3D-эффекты меняют видимую площадь и углы, и читатель хуже сравнивает значения. Для долей и сравнения категорий лучше чистый 2D `encoding`, где величины сравниваются без оптических искажений.
20Вы сравниваете продажи по товарам: значения от 1 до 1 000 000, и на обычной шкале маленькие значения почти не видны. Что корректнее сделать со шкалой `axis`?
AОбрезать `baseline` у `bar chart`, чтобы маленькие значения стали заметнее
BУдалить товары с маленькими значениями, чтобы они не мешали
CСделать 3D столбцы, чтобы добавить объём
DИспользовать `log scale` на `axis` Y и явно подписать, что шкала логарифмическая
Ответ: `Log scale` помогает сравнивать порядки величин, но её нужно явно обозначать на `axis`.
`Log scale` сжимает большие значения и делает видимыми меньшие, не прибегая к обману через обрезанный `baseline`. Важно подписать шкалу, иначе читатель неверно интерпретирует расстояния и разницы.
Хотите тренировать интерактивно?
В приложении — таймер, прогресс, стрики и 1700+ вопросов по всем темам.
Тренировать в TelegramДругие темы: Визуализация данных