После обновления SDK вы видите, что сумма по purchase_succeeded выросла почти в 2 раза, но платежный провайдер этого не подтверждает. Что наиболее вероятно и какое действие по data quality самое уместное?

AПользователи стали покупать чаще, оставляем как есть.
BНужно подождать неделю: метрики «усреднятся» и проблема исчезнет.
CНужно удалить все события с одинаковым event_time, это точно дубликаты.
DВероятна повторная отправка событий (at-least-once); нужен уникальный event_id или dedup_key и дедупликация в пайплайне.
Правильный ответ. Дубликаты часто возникают из-за повторной отправки при сетевых ретраях, поэтому нужен механизм дедупликации через event_id или dedup_key.

Разбор

Если источник истины (провайдер) не подтверждает рост, это сильный сигнал, что проблема в instrumentation или обработке событий. Удаление по event_time опасно: реальные покупки могут происходить близко по времени, а часы на устройстве могут быть неточными. Правильнее закладывать дедуп на уровне идентификаторов события и транзакции. Затем инварианты по уникальности order_id помогут автоматически ловить повторения.

Проверь себя · 1/3разбор после ответа
В мобильном приложении события могут копиться офлайн и отправляться позже. Какие поля времени лучше заложить в logging, чтобы корректно строить user journey и контролировать задержки?
Тренировать продукт в Telegram

Ещё вопросы по теме «Инструментация и качество данных»