Для метрики удержания вы определяете множество A — уникальные пользователи, активные в неделю 1, и множество B — уникальные пользователи, активные в неделю 2. Какое множество соответствует вернувшимся пользователям?
AОбъединение множеств A и B: уникальные пользователи, активные хотя бы в одну из двух недель
BПересечение множеств A и B: уникальные пользователи, активные в обе недели одновременно
CМножество A без пересечения с B: пользователи, активные только в неделю 1 и не вернувшиеся
DМножество B без пересечения с A: пользователи, активные только в неделю 2 как новички недели
Правильный ответ. Вернувшиеся пользователи — это пересечение множеств активных в разные периоды.
Разбор
Вернувшимися считают пользователей, которые были активны в обоих периодах — это пересечение множеств A и B. Объединение даёт всех, кто был активен хотя бы раз, и не отражает возвращаемость. Разности множеств описывают тех, кто пришёл только в одну из недель, и тоже не подходят для удержания. Корректная работа с пересечением помогает строить когортные отчёты и избегать ошибок в дедупликации.
Проверь себя · 1/3разбор после ответа
Для метрики удержания вы определяете множество A — уникальные пользователи, активные в неделю 1, и множество B — уникальные пользователи, активные в неделю 2. Какое множество соответствует вернувшимся пользователям?
Ещё вопросы по теме «Теория множеств и дедупликация»
- В таблице событий за день записано 2 млн строк, а в отчёте по аудитории видно 1.2 млн уникальных пользователей. Какое объяснение наиболее вероятно?
- В канале «поиск» 400 тыс уникальных пользователей, в канале «соцсети» 300 тыс, а пересечение между ними 100 тыс. Сколько уникальных пользователей в объединении этих двух множеств?
- В отчёте уникальные пользователи по каналам: email 200 тыс, push 150 тыс, sms 50 тыс. Сумма по строкам — 400 тыс, а общий итог по всем каналам — 260 тыс уникальных пользователей. Что это чаще всего означает?
- Чтобы посчитать число уникальных пользователей в объединении двух множеств `A` и `B`, зная `|A|`, `|B|` и `|A intersection B|`, какую формулу включения–исключения нужно использовать?
- Вы считаете число покупателей как уникальных пользователей за день. В данных есть `device_id` и `user_id` (если пользователь залогинен). Какой подход к дедупликации обычно более корректен?
- Все вопросы по «Теория множеств и дедупликация» →