В каталоге всего 10 тыс товаров. В отчёте за день показатель уникальных проданных позиций равен 12 тыс. Что говорит проверка ограничений на адекватность?

AЭто нормально: продажи могут быть выше размера каталога из-за возвратов и повторных оформлений за один и тот же день одной и той же позицией
BЭто означает, что каталог вырос в этот день за счёт новых поступлений, и метрика автоматически корректна без дополнительной проверки и сверки
CНужно умножить 12 тыс на средний чек, чтобы перевести количество в выручку и проверить, попадает ли результат в ожидаемый диапазон по выручке
DНарушена верхняя граница: уникальных проданных позиций не может быть больше размера каталога, значит вероятна ошибка джойна, фильтра или дедупликации
Правильный ответ. Если результат превышает очевидную верхнюю границу, сначала ищите ошибку в расчёте, а не объяснение в данных по бизнесу.

Разбор

При фиксированном каталоге максимум уникальных позиций за день ограничен размером каталога. Значение выше этой верхней границы обычно появляется из-за неверного уровня уникальности (например, считаете sku_id вместе с store_id) или из-за дублей после джойна. Грубая проверка ограничений помогает быстро локализовать такие баги. После исправления стоит сверить ключи агрегации и логику дедупликации.

Проверь себя · 1/3разбор после ответа
Система пишет 1 TB логов в день. По предположениям, размер одного события — от 200 до 500 байт. Какой диапазон количества событий в день наиболее разумен по порядку величины?
Открыть Карьерник в Telegram

Ещё вопросы по теме «Sanity-check и оценка»