Какой invariant наиболее уместно добавить в ежедневный отчет по воронке e-commerce, чтобы ловить ошибки данных?
AСредний чек должен быть одинаковым каждый день
B
orders ≤ checkouts ≤ add_to_cart ≤ product_views по одному и тому же окну времениCДоля iOS-трафика должна всегда быть ровно 50 процентов
DВыручка должна быть целым числом без копеек
Правильный ответ. Логические отношения между шагами воронки — сильный
invariant для поиска багов.Разбор
Количество пользователей или событий на более позднем шаге не должно превышать предыдущий шаг, если определения согласованы. Нарушение такого invariant часто означает duplicates, неверную дедупликацию или смешение окон времени. Это быстрый способ поймать ошибки еще до интерпретации результата эксперимента или отчета.
Проверь себя · 1/3разбор после ответа
Какой
sanity check наиболее полезен, чтобы поймать «тихую» неполную загрузку дневной partition, когда данные частично не приехали?Ещё вопросы по теме «Качество данных и инварианты»
- В ежедневном дашборде `DAU` и количество событий резко упали начиная с 02:00 и остаются низкими до конца дня. Что проверить первым, чтобы быстро понять, это `missing data` или реальный бизнес-эффект?
- Выручка по событиям в продуктовой витрине на 5 процентов выше, чем в платежной системе за тот же день. Что логичнее всего проверить первым в рамках `reconciliation`?
- Вчера число событий `purchase` выросло в 2 раза, но число уникальных `order_id` почти не изменилось. Какой источник проблемы наиболее вероятен?
- Метрики за понедельник резко просели, а за вторник резко выросли, при этом сумма за 2 дня почти не изменилась. Какой `sanity check` лучше всего указывает на `time shift`?
- После релиза приложения количество событий `add_to_cart` из Android стало почти ноль, а iOS и web без изменений. Что вероятнее всего проверить первым?
- Все вопросы по «Качество данных и инварианты» →