Для campaign у вас есть таблицы impressions и clicks (оба — events). Маркетинг спрашивает, сколько unique users и видели, и кликали. Что нужно посчитать?

AСложить unique users из impressions и unique users из clicks.
BПосчитать union impressions и clicks и назвать это кликнувшими.
CСделать deduplication по user_id в обоих set и взять их intersection.
DПосчитать количество clicks events, потому что каждый клик — это уникальный user.
Правильный ответ. Сколько unique users сделали два действия, определяется как intersection двух set по user_id.

Разбор

Сначала определите два set: user_id, которые есть в impressions, и user_id, которые есть в clicks. Затем найдите их intersection, потому что вам нужны те, кто принадлежит обоим set. Сумма или union ответит на другой вопрос и будет завышена из-за отсутствия правильной deduplication. Это частая ошибка, когда путают events и unique users.

Проверь себя · 1/3разбор после ответа
В таблице orders каждая строка — один order (event), а один user_id может сделать несколько orders. Вы хотите посчитать число buyers как unique users. Какой счётчик соответствует задаче deduplication buyers?
Открыть Карьерник в Telegram

Ещё вопросы по теме «Теория множеств и дедупликация»