Какое наблюдение сильнее всего говорит, что падение conversion rate связано с реальным бизнес-эффектом, а не с missing data?
AПадение видно только в одном дашборде, а в сырых данных метрика не падала
BПадение подтверждается независимыми источниками
billing и support, а sanity check по row count и max(event_time) не показывает провалаCПадение видно только в одной версии
ETL, а другие отчеты не тронутыDОдновременно вырос
null rate в ключевых полях, значит это бизнес-эффектПравильный ответ. Подтверждение эффекта независимыми источниками при нормальных
sanity check чаще указывает на реальный бизнес-эффект.Разбор
Если row count и max(event_time) выглядят нормально, меньше шансов, что проблема в неполноте данных. Когда эффект одновременно виден в независимых системах, например billing, и сопровождается сигналами из support, это усиливает гипотезу бизнес-изменения. После этого имеет смысл сегментировать эффект и проверить, не совпал ли он с продуктовым релизом или изменением политики.
Проверь себя · 1/3разбор после ответа
После обогащения отчета справочником число строк стало сильно больше, а
DAU в отчете превысил DAU в исходной витрине событий. Что наиболее вероятно произошло?Ещё вопросы по теме «Качество данных и инварианты»
- В ежедневном дашборде `DAU` и количество событий резко упали начиная с 02:00 и остаются низкими до конца дня. Что проверить первым, чтобы быстро понять, это `missing data` или реальный бизнес-эффект?
- Какой `invariant` наиболее уместно добавить в ежедневный отчет по воронке e-commerce, чтобы ловить ошибки данных?
- Выручка по событиям в продуктовой витрине на 5 процентов выше, чем в платежной системе за тот же день. Что логичнее всего проверить первым в рамках `reconciliation`?
- Вчера число событий `purchase` выросло в 2 раза, но число уникальных `order_id` почти не изменилось. Какой источник проблемы наиболее вероятен?
- Метрики за понедельник резко просели, а за вторник резко выросли, при этом сумма за 2 дня почти не изменилась. Какой `sanity check` лучше всего указывает на `time shift`?
- Все вопросы по «Качество данных и инварианты» →