Вы описываете схему событий для purchase_succeeded. Как лучше хранить сумму покупки в свойствах события, чтобы избежать проблем качества данных при агрегациях?

AХранить amount='1990 RUB' строкой с символом валюты: значение сразу читается человеком в отчётах и интерфейсах
BХранить amount='1 990' строкой с разделителями именно так, как сумма отображается пользователю в интерфейсе приложения
CХранить amount_minor=1990 числом в минимальных единицах и currency='RUB' отдельным свойством для последующих агрегаций
DХранить amount=1990.0 числом с плавающей точкой и без отдельного поля валюты, а валюту определять по стране пользователя
Правильный ответ. Для аналитики лучше хранить числовое поле и валюту отдельно, чтобы избежать парсинга и неоднозначностей в свойствах события.

Разбор

Суммы в событиях лучше хранить целым числом в минимальных единицах валюты (копейки, центы) и валюту класть отдельным полем. Это исключает ошибки округления float, упрощает агрегации SUM и фильтрацию по валюте, и не требует парсинга строк в ETL. Строковые форматы вроде '1990 RUB' или '1 990' ломают арифметические операции и зависят от локали. Хранение float без валюты вынуждает определять её по косвенным признакам, что приводит к ошибкам у мультивалютных пользователей.

Тренировать продукт в Telegram

Ещё вопросы по теме «Инструментация и качество данных»