После обновления SDK вы видите, что сумма по purchase_succeeded выросла почти в 2 раза, но платежный провайдер этого не подтверждает. Что наиболее вероятно и какое действие по data quality самое уместное?
AПользователи стали покупать чаще, оставляем как есть.
BНужно подождать неделю: метрики «усреднятся» и проблема исчезнет.
CНужно удалить все события с одинаковым
event_time, это точно дубликаты.DВероятна повторная отправка событий (
at-least-once); нужен уникальный event_id или dedup_key и дедупликация в пайплайне.Правильный ответ. Дубликаты часто возникают из-за повторной отправки при сетевых ретраях, поэтому нужен механизм дедупликации через
event_id или dedup_key.Разбор
Если источник истины (провайдер) не подтверждает рост, это сильный сигнал, что проблема в instrumentation или обработке событий. Удаление по event_time опасно: реальные покупки могут происходить близко по времени, а часы на устройстве могут быть неточными. Правильнее закладывать дедуп на уровне идентификаторов события и транзакции. Затем инварианты по уникальности order_id помогут автоматически ловить повторения.
Проверь себя · 1/3разбор после ответа
В мобильном приложении события могут копиться офлайн и отправляться позже. Какие поля времени лучше заложить в
logging, чтобы корректно строить user journey и контролировать задержки?Ещё вопросы по теме «Инструментация и качество данных»
- Вы проектируете `event taxonomy` для регистрации. Какой вариант `instrumentation` лучше всего подходит, чтобы считать конверсию в успешную регистрацию и понимать, через какой способ вошли?
- Вы хотите логировать применение фильтров в каталоге. Какой вариант лучше для `event taxonomy` и последующей аналитики?
- Вы настраиваете мониторинг `data quality` для платёжного флоу. Какой набор `invariants` наиболее практичен и устойчив к сезонности?
- В мобильном приложении события могут копиться офлайн и отправляться позже. Какие поля времени лучше заложить в `logging`, чтобы корректно строить `user journey` и контролировать задержки?
- Вы описываете `event taxonomy` для `purchase_succeeded`. Как лучше хранить сумму покупки в `properties`, чтобы избежать проблем `data quality` при агрегациях?
- Все вопросы по «Инструментация и качество данных» →