В отчёте вы видите unique users по channel: email 200 тыс, push 150 тыс, sms 50 тыс. Сумма по строкам 400 тыс, но общий итог по всем channel показывает 260 тыс unique users. Что это чаще всего означает?
AВ итоговой строке ошибка: общий итог обязан быть равен сумме по
channel.BВ отчёте перепутаны
units: нужно делить сумму на количество channel.CЕсть
overlap между channel, а общий итог считает union с deduplication, поэтому сумма по channel может быть больше итога.D
intersection между всеми channel равна 0, поэтому итог должен быть больше суммы.Правильный ответ. Суммирование по
channel обычно двойно считает overlap, а общий итог считает union после deduplication.Разбор
Один user_id мог попасть сразу в несколько channel, поэтому он окажется в нескольких строках. Общая строка обычно строится как union по всем channel и делает deduplication на уровне unique users. Поэтому несхождение суммы и итога — нормальный сигнал наличия overlap, а не обязательно баг.
Проверь себя · 1/3разбор после ответа
Маркетинг просит сегмент
unique users, которые являются buyers продукта A и buyers продукта B за месяц. Какая операция над set buyers соответствует запросу?Ещё вопросы по теме «Теория множеств и дедупликация»
- В `events` за день 2 млн `events`, а в отчёте по `audience` 1.2 млн `unique users`. Какое объяснение наиболее вероятно?
- В `channel` `search` 400 тыс `unique users`, в `channel` `social` 300 тыс `unique users`, а `overlap` (`intersection`) между ними 100 тыс `unique users`. Сколько `unique users` в `union` этих двух `set`?
- Чтобы посчитать `unique users` в `union` двух `set` `A` и `B`, зная `|A|`, `|B|` и `|A intersection B|`, какую формулу `включение–исключение` нужно использовать?
- Вы считаете число `buyers` как `unique users` за день. В данных есть `device_id` и `user_id` (если `user` залогинен). Какой подход к `deduplication` чаще всего более корректен для подсчёта `buyers`?
- Аналитик сложил `DAU` за 30 дней и получил 3 млн, а `MAU` за тот же месяц равен 400 тыс `unique users`. Почему это может быть нормально?
- Все вопросы по «Теория множеств и дедупликация» →