В отчете по странам доля unknown резко выросла до 40 процентов, и региональные метрики стали «прыгать». Что проверить первым?

AПокрытие ключа country_id: рост null rate после join и появление новых кодов, которых нет в справочнике
BСчитать, что пользователи массово переехали и страна перестала определяться
CИгнорировать unknown, потому что он всегда шум в данных
DПоменять группировку на континенты, чтобы скрыть проблему
Правильный ответ. Резкий рост null rate после join обычно указывает на проблемы ключей или missing data в справочнике.

Разбор

Причина может быть в рассинхронизации справочника, смене формата country_id или появлении новых значений без обновления витрины. Сделайте reconciliation покрытия: какая доля фактов не находит матч в справочнике и как это изменилось относительно контроля. После этого проверяют обновления schema и расписание загрузки справочника.

Проверь себя · 1/3разбор после ответа
В отчете по странам доля unknown резко выросла до 40 процентов, и региональные метрики стали «прыгать». Что проверить первым?
Открыть Карьерник в Telegram

Ещё вопросы по теме «Качество данных и инварианты»