В отчёте по странам доля сегмента unknown резко выросла до 40 процентов, и региональные метрики стали «прыгать». Что проверить первым?
AСегмент
unknown отражает реальное географическое смещение аудитории: пользователи переехали и страна перестала определятьсяBСегмент
unknown стоит игнорировать в отчёте и не учитывать его при принятии решений по региональным метрикамCПокрытие ключа
country_id: рост доли NULL после JOIN со справочником и появление новых кодов вне справочника витриныDЗамена группировки на континенты вместо
country_id: новый разрез сглаживает скачок и стабилизирует доли в отчётеПравильный ответ. Резкий рост доли
NULL после JOIN обычно указывает на проблемы ключей или пропусков в справочнике.Разбор
Причина может быть в рассинхронизации справочника, смене формата country_id или появлении новых значений без обновления витрины. Сделайте сверку покрытия: какая доля фактов не находит совпадение в справочнике и как это изменилось относительно контрольного периода. После этого проверяют обновления схемы и расписание загрузки справочника. Версии «пользователи переехали», «unknown всегда шум» или «давайте скроем за группировкой по континентам» уводят от настоящей причины и закрепляют поломку.
Проверь себя · 1/2разбор после ответа
Вчера число событий
purchase выросло в 2 раза, но число уникальных order_id почти не изменилось. Какой источник проблемы наиболее вероятен?Ещё вопросы по теме «Качество данных и инварианты»
- В ежедневном дашборде `DAU` и количество событий резко упали начиная с 02:00 и остаются низкими до конца дня. Что проверить первым, чтобы быстро понять, это потеря данных или реальный бизнес-эффект?
- Какой инвариант наиболее уместно добавить в ежедневный отчёт по воронке e-commerce, чтобы быстро ловить ошибки данных?
- Выручка по событиям в продуктовой витрине на 5 процентов выше, чем в платёжной системе за тот же день. Что логичнее всего проверить первым в рамках сверки данных?
- Вчера число событий `purchase` выросло в 2 раза, но число уникальных `order_id` почти не изменилось. Какой источник проблемы наиболее вероятен?
- Метрики за понедельник резко просели, а за вторник резко выросли, при этом сумма за два дня почти не изменилась. Какая проверка лучше всего указывает на сдвиг времени?
- Все вопросы по «Качество данных и инварианты» →