У вас три множества для трёх кампаний: известны |A|, |B|, |C| и все парные пересечения, но тройное пересечение неизвестно. Что корректнее всего сделать, если нужно оценить объединение без доступа к сырым данным?

AПосчитать объединение по формуле |A| + |B| + |C| и игнорировать парные пересечения, потому что при крупных кампаниях вклад пересечений всегда мал
BПо принципу включения–исключения признать неопределённость тройного пересечения |A∩B∩C| и дать границы для объединения или запросить пересчёт по сырым данным
CВзять среднее значений |A|, |B|, |C| и считать его оценкой объединения трёх кампаний, потому что среднее ближе всего к истинному размеру охвата
DВыбрать максимум из |A|, |B|, |C| и считать его объединением, потому что вклад тройного пересечения всё равно сам исправит расхождения с реальностью
Правильный ответ. Для трёх множеств точное объединение по принципу включения–исключения требует тройного пересечения, иначе остаются только границы.

Разбор

Парные пересечения недостаточны, потому что тройное пересечение влияет на итог через знак плюс в формуле включения–исключения. Без него вы можете построить только диапазон возможных значений объединения, используя нижнюю и верхнюю границы для тройного пересечения. В продуктовой аналитике важно явно проговаривать такие допущения, чтобы не выдавать оценку за точный факт. Лучший вариант — запросить расчёт тройного пересечения по сырым данным.

Проверь себя · 1/3разбор после ответа
В канале «поиск» 400 тыс уникальных пользователей, в канале «соцсети» 300 тыс, а пересечение между ними 100 тыс. Сколько уникальных пользователей в объединении этих двух множеств?
Открыть Карьерник в Telegram

Ещё вопросы по теме «Теория множеств и дедупликация»