В отчёте одновременно упали почти все метрики: число сессий, событий, выручка, и падение начинается ровно с 14:00. Какое наблюдение лучше всего подтверждает гипотезу о пропусках в данных?
AПадение совпало с выходными, поэтому это сезонное снижение активности пользователей и обычные суточные колебания трафика
BПадение есть только у одного канала привлечения, а у остальных каналов поведение метрик стабильное и без аномалий по дням
CВ сырых данных почасовое число строк резко становится близким к нулю после 14:00 и не восстанавливается до конца суток
DСредний чек заметно вырос за тот же период, поэтому данные точно корректны и проблема в реальном поведении пользователей
Правильный ответ. Резкий «обрыв» числа строк в сырых логах в конкретный час — характерный признак пропусков в данных.
Разбор
Системные сбои сбора и доставки данных часто дают ступеньку в определённый момент времени. Сравните число строк по часам и max(event_time) с контрольными днями, проверьте мониторинги доставки. Если провал есть в сырых данных, дальнейшая статистика по бизнес-эффектам до восстановления данных будет некорректной.
Проверь себя · 1/2разбор после ответа
Вчера число событий
purchase выросло в 2 раза, но число уникальных order_id почти не изменилось. Какой источник проблемы наиболее вероятен?Ещё вопросы по теме «Качество данных и инварианты»
- В ежедневном дашборде `DAU` и количество событий резко упали начиная с 02:00 и остаются низкими до конца дня. Что проверить первым, чтобы быстро понять, это потеря данных или реальный бизнес-эффект?
- Какой инвариант наиболее уместно добавить в ежедневный отчёт по воронке e-commerce, чтобы быстро ловить ошибки данных?
- Выручка по событиям в продуктовой витрине на 5 процентов выше, чем в платёжной системе за тот же день. Что логичнее всего проверить первым в рамках сверки данных?
- Вчера число событий `purchase` выросло в 2 раза, но число уникальных `order_id` почти не изменилось. Какой источник проблемы наиболее вероятен?
- Метрики за понедельник резко просели, а за вторник резко выросли, при этом сумма за два дня почти не изменилась. Какая проверка лучше всего указывает на сдвиг времени?
- Все вопросы по «Качество данных и инварианты» →