Вчера число событий purchase выросло в 2 раза, но число уникальных order_id почти не изменилось. Какой источник проблемы наиболее вероятен?
AРеальный рост продаж без увеличения количества заказов
BСбой в платежной системе, из-за которого платежи считаются дважды в банке
CОшибка округления выручки при конвертации валют
DПоявились
duplicates из-за повторной отправки события или ретраев в loggingПравильный ответ. Если уникальных ключей не стало больше, а событий стало больше, это типичный признак
duplicates.Разбор
При повторной доставке событие может записаться несколько раз, особенно при at-least-once delivery и ретраях. Проверяйте уникальность event_id и повторяемость order_id с одинаковыми атрибутами. Исправления обычно включают deduplication и idempotency на стороне приемника или пайплайна.
Проверь себя · 1/3разбор после ответа
Вы подозреваете
duplicates в событиях из-за ретраев. Какой sanity check самый прямой?Ещё вопросы по теме «Качество данных и инварианты»
- В ежедневном дашборде `DAU` и количество событий резко упали начиная с 02:00 и остаются низкими до конца дня. Что проверить первым, чтобы быстро понять, это `missing data` или реальный бизнес-эффект?
- Какой `invariant` наиболее уместно добавить в ежедневный отчет по воронке e-commerce, чтобы ловить ошибки данных?
- Выручка по событиям в продуктовой витрине на 5 процентов выше, чем в платежной системе за тот же день. Что логичнее всего проверить первым в рамках `reconciliation`?
- Метрики за понедельник резко просели, а за вторник резко выросли, при этом сумма за 2 дня почти не изменилась. Какой `sanity check` лучше всего указывает на `time shift`?
- После релиза приложения количество событий `add_to_cart` из Android стало почти ноль, а iOS и web без изменений. Что вероятнее всего проверить первым?
- Все вопросы по «Качество данных и инварианты» →