Question 1

Вы хотите добавить новое свойство `promo_code` в событие `checkout_started`. Какой подход лучше с точки зрения `data quality` и совместимости?

Accepted Answer

Безопасная эволюция схемы обычно означает добавление необязательных `properties` и обновление контрактов `event taxonomy`. Резкие переименования и удаление старых полей ломают отчёты и пайплайны, особенно если разные версии приложения живут параллельно. Добавление необязательного свойства позволяет плавно раскатить изменение и сохранить историческую сопоставимость. Валидации помогут контролировать заполнение нового поля и выявлять платформенные расхождения. Изменение типов существующих полей — частая причина поломок в `logging` и запросах.

Question 2

Вы хотите убрать дубликаты для `purchase_succeeded`. Какой `dedup_key` наиболее безопасен, чтобы не «съесть» реальные повторные покупки одного пользователя?

Accepted Answer

Дедупликация должна опираться на идентификатор транзакции (`order_id`), а не на время или пользователя. Пользователь может совершать несколько покупок, поэтому `user_id` не подходит как ключ дедупа. Время устройства может быть неточным, а разные покупки могут происходить близко по времени. Сумма также не уникальна и приведёт к потере валидных событий. `Order_id` или `transaction_id` отражают уникальность покупки, а `event_id` помогает удалять повторные доставки одного и того же события в пайплайне `logging`.

Question 3

После релиза Android `app_version='5.2'` `DAU` по событию `app_open` упал на 30%. При этом по той же версии объём `screen_view` и `purchase_succeeded` почти не изменился. Какое объяснение наиболее вероятно и что делать?

Accepted Answer

Если падает один `event`, а соседние события стабильны, это часто баг `logging`, а не реальное изменение поведения. События `screen_view` и `purchase_succeeded` подразумевают, что приложение всё же открывают и используют. Значит, вероятнее всего, конкретно `app_open` перестал отправляться или изменилось имя/условие отправки в `app_version='5.2'`. Правильный шаг — проверить `event taxonomy` и сравнить код `instrumentation` до/после релиза, а также добавить `invariants`, например отношение `screen_view` к `app_open` в разрезе версий. Это позволяет быстро отличить продуктовый эффект от поломки данных.

Question 4

Вы настраиваете мониторинг `data quality` для платёжного флоу. Какой набор `invariants` наиболее практичен и устойчив к сезонности?

Accepted Answer

Хорошие `invariants` проверяют структуру и логическую согласованность событий, а не «идеальные» бизнес-отношения. Ожидать фиксированную конверсию или нулевые ошибки — слишком строго и не связано напрямую с качеством `logging`. Задержки и переупорядочивание возможны из-за сети и очередей, это не всегда проблема. Инварианты про обязательные `properties` и уникальность `order_id` напрямую ловят типовые баги: пропуски полей и дубликаты. Такие проверки дают ранние сигналы, что `instrumentation` сломалась, не путая это с изменением поведения пользователей.

Question 5

После релиза iOS конверсия из `add_to_cart` в `purchase_succeeded` резко упала, но вы не уверены, это продуктовый эффект или проблемы `logging`. Какое действие наиболее корректно?

Accepted Answer

При резком сдвиге воронки сначала проверяют `data quality`: схему, поля, объёмы и соответствие источнику истины. Продуктовый эффект и баг `logging` могут выглядеть одинаково на графике конверсии. Поэтому нужно сравнить событие и его `properties` до/после релиза, посмотреть распределения по `app_version` и проверить, не появились ли пропуски критичных полей вроде `order_id`. Сверка с заказами или провайдером помогает понять, действительно ли покупок стало меньше. После диагностики стоит закрепить `invariants` и валидации, чтобы следующий раз сигнал пришёл сразу и с указанием причины.

Инструментация и качество данных: вопросы для собеседования (часть 4)

Вопросы 16–20 из 20

Хотите тренировать интерактивно?

Другие темы: Продуктовая аналитика