В events за день 2 млн events, а в отчёте по audience 1.2 млн unique users. Какое объяснение наиболее вероятно?

AОдин и тот же user_id может сгенерировать много events, поэтому events обычно больше, чем unique users.
BПосле deduplication количество events всегда должно стать равно числу unique users.
Cunique users считаются как intersection двух set, поэтому число всегда меньше events.
Dunique users — это то же самое, что union всех events, поэтому разницы быть не должно.
Правильный ответ. Число events и число unique users измеряют разные units и не обязаны совпадать.

Разбор

В одном set events один user_id может встречаться много раз, поэтому счётчик events растёт быстрее. Метрика unique users делает deduplication по user_id и считает каждого user один раз за период. Такой проверка здравого смысла помогает не перепутать объём events с размером audience.

Проверь себя · 1/3разбор после ответа
В channel search 400 тыс unique users, в channel social 300 тыс unique users, а overlap (intersection) между ними 100 тыс unique users. Сколько unique users в union этих двух set?
Открыть Карьерник в Telegram

Ещё вопросы по теме «Теория множеств и дедупликация»