Аналитик сложил DAU за 30 дней и получил 3 млн, а MAU за тот же месяц равен 400 тыс unique users. Почему это может быть нормально?

AПотому что MAU всегда равен сумме DAU по дням.
BПотому что сумма DAU не делает deduplication между днями, а MAU — это union unique users за месяц.
CПотому что DAU считает events, а MAU считает impressions.
DПотому что intersection между днями всегда равна 0.
Правильный ответ. Сумма DAU по дням двойно считает overlap пользователей между днями, а MAU считает union.

Разбор

Один и тот же user_id может быть активен много дней подряд, и тогда он попадёт в каждый дневной set DAU. Сложение дневных значений не учитывает intersection между днями и завышает итог. MAU — это deduplication по user_id на уровне месяца, то есть union всех дневных set.

Проверь себя · 1/3разбор после ответа
Для campaign у вас есть таблицы impressions и clicks (оба — events). Маркетинг спрашивает, сколько unique users и видели, и кликали. Что нужно посчитать?
Открыть Карьерник в Telegram

Ещё вопросы по теме «Теория множеств и дедупликация»