Чтобы посчитать unique users в union двух set A и B, зная |A|, |B| и |A intersection B|, какую формулу включение–исключение нужно использовать?

A|A union B| = |A| + |B| + |A intersection B|
B|A union B| = |A| - |B| - |A intersection B|
C|A union B| = |A| * |B| / |A intersection B|
D|A union B| = |A| + |B| - |A intersection B|
Правильный ответ. Для двух set принцип включение–исключение требует вычесть intersection, чтобы убрать двойной счёт overlap.

Разбор

Каждый user из intersection попадает и в A, и в B, поэтому при суммировании он считается дважды. Вычитание |A intersection B| возвращает правильный размер union. Эта формула лежит в основе многих задач про unique users по нескольким источникам.

Проверь себя · 1/3разбор после ответа
Маркетинг просит сегмент unique users, которые являются buyers продукта A и buyers продукта B за месяц. Какая операция над set buyers соответствует запросу?
Открыть Карьерник в Telegram

Ещё вопросы по теме «Теория множеств и дедупликация»