Вы хотите оценить общий union unique users между web и app. В web ключ — cookie_id, в app ключ — user_id, и прямого соответствия между ними нет. Какое решение наиболее корректно с точки зрения deduplication и constraints?

AПросто сложить unique users из web и app: overlap можно игнорировать.
BВсегда считать, что overlap равен 0, потому что ключи разные.
CВсегда считать, что overlap равен 100%, потому что это один продукт.
DПризнать, что точный deduplication невозможен без identity связи, и либо построить маппинг cookie_iduser_id, либо дать границы для union (между нижняя граница и верхняя граница).
Правильный ответ. Без общего identity ключа точный union unique users нельзя получить, остаются маппинг или границы.

Разбор

Разные идентификаторы создают неопределённый overlap: часть людей будет в обоих источниках, но вы не знаете, какая именно. Корректная аналитика либо строит identity маппинг, либо честно даёт диапазон границы для union. Lower bound — это максимум из двух аудиторий, верхняя граница — их сумма. Такой ответ показывает зрелое понимание ограничений deduplication.

Проверь себя · 1/3разбор после ответа
Для campaign у вас есть таблицы impressions и clicks (оба — events). Маркетинг спрашивает, сколько unique users и видели, и кликали. Что нужно посчитать?
Открыть Карьерник в Telegram

Ещё вопросы по теме «Теория множеств и дедупликация»