В ежедневной time series событий один день трекинг был сломан: данных нет, но пользователи были. Как корректнее отобразить этот день на графике?
Line chart — стандарт для визуализации временных рядов: DAU, revenue, конверсия по дням. На собеседовании спрашивают, как показать сезонность, тренд и аномалии на одном графике, нужна ли ось Y с нуля и как сравнить несколько метрик с разными масштабами. Временные ряды — самый частый тип визуализации в аналитике.
Всего в этом разделе 20 вопросов. Каждый — с правильным ответом и кратким разбором теории. Разбито на 4 части по 5 вопросов.
3Команда хочет найти день, когда произошёл резкий сбой (падение конверсии на один день). Почему график `cumulative` может быть плохим выбором?
A`Cumulative` всегда лучше: он показывает всё сразу
B`Cumulative` нельзя строить для `time series`
C`Cumulative` автоматически убирает `seasonality`, поэтому годится для любого анализа
D`Cumulative` сглаживает краткосрочные провалы: разовый сбой может почти не быть заметен, лучше смотреть обычную `time series` по дням
Ответ: `Cumulative` полезен для прогресса, но скрывает краткосрочные изменения.
Кумулятивная кривая растёт почти монотонно и «размазывает» локальные провалы. Для аномалий лучше дневная `time series`, а `rolling average` можно добавить как вспомогательное сглаживание.
4Вы строите график выручки магазина как `time series` по дням. Какую агрегацию по дням выбрать для `revenue`?
AСредний чек (`AOV` (Average Order Value — средний чек)) за день
BСумму `revenue` за день
CМедиану `revenue` на пользователя
DКоличество визитов в день
Ответ: Для выручки по времени обычно нужна сумма за период.
Если цель — сколько денег получили за день, нужно суммировать `revenue`. `AOV` (Average Order Value — средний чек) отвечает на другой вопрос и может расти при падении числа заказов.