У вас три канала рассылок: e-mail — 100 тыс уникальных пользователей, push — 120 тыс, SMS — 60 тыс. Парные пересечения: e-mail и push = 40 тыс, e-mail и SMS = 10 тыс, push и SMS = 20 тыс. Тройное пересечение всех трёх каналов = 5 тыс. Сколько уникальных пользователей в объединении трёх каналов по формуле включений-исключений?

A210 тыс
B205 тыс
C280 тыс
D215 тыс
Правильный ответ. Для трёх множеств формула включений-исключений использует сумму размеров, минус парные пересечения, плюс тройное пересечение.

Разбор

При суммировании размеров множеств тройное пересечение учитывается три раза, а при вычитании парных пересечений оно вычитается тоже три раза, поэтому его нужно добавить обратно один раз. Формула: |A ∪ B ∪ C| = |A| + |B| + |C| − |A ∩ B| − |A ∩ C| − |B ∩ C| + |A ∩ B ∩ C|. Подставим: 100 + 120 + 60 − 40 − 10 − 20 + 5 = 215 тыс. Это типовая задача для оценки охвата уникальных пользователей по нескольким каналам.

Проверь себя · 1/3разбор после ответа
Для метрики удержания вы определяете множество A — уникальные пользователи, активные в неделю 1, и множество B — уникальные пользователи, активные в неделю 2. Какое множество соответствует вернувшимся пользователям?
Открыть Карьерник в Telegram

Ещё вопросы по теме «Теория множеств и дедупликация»