В отчёте вы видите unique users по channel: email 200 тыс, push 150 тыс, sms 50 тыс. Сумма по строкам 400 тыс, но общий итог по всем channel показывает 260 тыс unique users. Что это чаще всего означает?

AВ итоговой строке ошибка: общий итог обязан быть равен сумме по channel.
BВ отчёте перепутаны units: нужно делить сумму на количество channel.
CЕсть overlap между channel, а общий итог считает union с deduplication, поэтому сумма по channel может быть больше итога.
Dintersection между всеми channel равна 0, поэтому итог должен быть больше суммы.
Правильный ответ. Суммирование по channel обычно двойно считает overlap, а общий итог считает union после deduplication.

Разбор

Один user_id мог попасть сразу в несколько channel, поэтому он окажется в нескольких строках. Общая строка обычно строится как union по всем channel и делает deduplication на уровне unique users. Поэтому несхождение суммы и итога — нормальный сигнал наличия overlap, а не обязательно баг.

Проверь себя · 1/3разбор после ответа
Маркетинг просит сегмент unique users, которые являются buyers продукта A и buyers продукта B за месяц. Какая операция над set buyers соответствует запросу?
Открыть Карьерник в Telegram

Ещё вопросы по теме «Теория множеств и дедупликация»