После обогащения отчета справочником число строк стало сильно больше, а DAU в отчете превысил DAU в исходной витрине событий. Что наиболее вероятно произошло?
AПользователей действительно стало больше именно после обогащения справочником
BСработала сезонность, из-за которой
DAU удваивается при добавлении справочникаCНарушена уникальность
primary key в справочнике, поэтому join стал one-to-many и породил duplicatesDСправочник всегда делает метрики более точными, поэтому рост
DAU ожидаемПравильный ответ. Рост количества строк после
join часто означает one-to-many и появление duplicates из-за неуникального ключа.Разбор
Если справочник содержит несколько строк на один primary key, то при join каждая факт-строка размножается. Это ломает invariant сопоставимости метрик до и после обогащения и может раздувать DAU. Проверьте уникальность ключа в справочнике и сделайте reconciliation количества строк до и после join.
Проверь себя · 1/3разбор после ответа
В отчете одновременно упали почти все метрики:
sessions, events, revenue, и падение начинается ровно с 14:00. Какое наблюдение лучше всего подтверждает гипотезу missing data?Ещё вопросы по теме «Качество данных и инварианты»
- В ежедневном дашборде `DAU` и количество событий резко упали начиная с 02:00 и остаются низкими до конца дня. Что проверить первым, чтобы быстро понять, это `missing data` или реальный бизнес-эффект?
- Какой `invariant` наиболее уместно добавить в ежедневный отчет по воронке e-commerce, чтобы ловить ошибки данных?
- Выручка по событиям в продуктовой витрине на 5 процентов выше, чем в платежной системе за тот же день. Что логичнее всего проверить первым в рамках `reconciliation`?
- Вчера число событий `purchase` выросло в 2 раза, но число уникальных `order_id` почти не изменилось. Какой источник проблемы наиболее вероятен?
- Метрики за понедельник резко просели, а за вторник резко выросли, при этом сумма за 2 дня почти не изменилась. Какой `sanity check` лучше всего указывает на `time shift`?
- Все вопросы по «Качество данных и инварианты» →