В отчете одновременно упали почти все метрики: sessions, events, revenue, и падение начинается ровно с 14:00. Какое наблюдение лучше всего подтверждает гипотезу missing data?

AПадение совпало с выходными, значит это точно сезонность
BПадение есть только у одного канала трафика, а остальные стабильны
CВ сырых данных почасовой row count резко становится близким к нулю после 14:00 и не восстанавливается
DСредний чек вырос, значит данные точно корректны
Правильный ответ. Резкий «обрыв» row count в сырых логах в конкретный час — характерный признак missing data.

Разбор

Системные сбои ingestion или pipeline часто дают ступеньку в определенный момент времени. Сравните row count и max(event_time) по часам с контрольными днями и проверьте мониторинги доставки. Если провал есть в сырых данных, дальнейшая статистика по бизнес-эффектам до восстановления данных будет некорректной.

Проверь себя · 1/3разбор после ответа
Вчера число событий purchase выросло в 2 раза, но число уникальных order_id почти не изменилось. Какой источник проблемы наиболее вероятен?
Открыть Карьерник в Telegram

Ещё вопросы по теме «Качество данных и инварианты»