В channel search 400 тыс unique users, в channel social 300 тыс unique users, а overlap (intersection) между ними 100 тыс unique users. Сколько unique users в union этих двух set?
A700 тыс
B600 тыс
C500 тыс
D300 тыс
Правильный ответ. Для двух
set размер union равен сумме размеров минус intersection по принципу включение–исключение.Разбор
Если просто сложить два channel, overlap будет посчитан дважды. Поэтому используйте включение–исключение: |A union B| = |A| + |B| - |A intersection B|. Это базовый приём для оценки unique users по нескольким channel.
Проверь себя · 1/3разбор после ответа
Аналитик сложил
DAU за 30 дней и получил 3 млн, а MAU за тот же месяц равен 400 тыс unique users. Почему это может быть нормально?Ещё вопросы по теме «Теория множеств и дедупликация»
- В `events` за день 2 млн `events`, а в отчёте по `audience` 1.2 млн `unique users`. Какое объяснение наиболее вероятно?
- В отчёте вы видите `unique users` по `channel`: `email` 200 тыс, `push` 150 тыс, `sms` 50 тыс. Сумма по строкам 400 тыс, но общий итог по всем `channel` показывает 260 тыс `unique users`. Что это чаще всего означает?
- Чтобы посчитать `unique users` в `union` двух `set` `A` и `B`, зная `|A|`, `|B|` и `|A intersection B|`, какую формулу `включение–исключение` нужно использовать?
- Вы считаете число `buyers` как `unique users` за день. В данных есть `device_id` и `user_id` (если `user` залогинен). Какой подход к `deduplication` чаще всего более корректен для подсчёта `buyers`?
- Аналитик сложил `DAU` за 30 дней и получил 3 млн, а `MAU` за тот же месяц равен 400 тыс `unique users`. Почему это может быть нормально?
- Все вопросы по «Теория множеств и дедупликация» →