При расчёте объединения трёх множеств вы посчитали |A ∪ B ∪ C| = |A| + |B| + |C| − |A ∩ B| − |A ∩ C| − |B ∩ C|, но не добавили |A ∩ B ∩ C|. Какое смещение в оценке объединения вы получите?

AОценка не изменится: тройное пересечение всегда равно нулю, поэтому в формуле включения–исключения его можно опустить
BПереоцените объединение, потому что тройное пересечение учитывается дважды, и без поправки получается верхняя граница
CНедооцените парные пересечения, но объединение останется точным независимо от того, добавили вы тройное пересечение или нет
DНедооцените объединение, потому что тройное пересечение нужно добавить обратно, и без него получается нижняя граница
Правильный ответ. В формуле включения–исключения для трёх множеств тройное пересечение нужно добавить обратно, иначе объединение получается заниженным.

Разбор

Тройное пересечение входит в каждое одиночное множество и в каждое парное пересечение, поэтому при вычитании парных пересечений оно обнуляется. Но в объединении оно должно учитываться один раз, поэтому его нужно добавить обратно. Если тройное пересечение неизвестно, выражение без него даёт нижнюю границу для объединения. Это типичная проверка адекватности при работе с тремя каналами или сегментами.

Проверь себя · 1/3разбор после ответа
Для метрики удержания вы определяете множество A — уникальные пользователи, активные в неделю 1, и множество B — уникальные пользователи, активные в неделю 2. Какое множество соответствует вернувшимся пользователям?
Открыть Карьерник в Telegram

Ещё вопросы по теме «Теория множеств и дедупликация»