Нужно посчитать количество уникальных пользователей, которые совершили событие либо в web (events_web(user_id)), либо в app (events_app(user_id)). Какой запрос посчитает корректно, если один и тот же пользователь мог быть в обоих источниках?
A
SELECT COUNT(*) FROM (SELECT user_id FROM events_web UNION ALL SELECT user_id FROM events_app) t;B
SELECT COUNT(*) FROM (SELECT user_id FROM events_web UNION SELECT user_id FROM events_app) t;C
SELECT COUNT(*) FROM events_web w INNER JOIN events_app a ON w.user_id = a.user_id;D
SELECT COUNT(*) FROM (SELECT user_id FROM events_web INTERSECT SELECT user_id FROM events_app) t;Правильный ответ. Для уникальных пользователей по двум источникам используйте
UNION (он убирает повторы) перед COUNT(*).Разбор
Если использовать UNION ALL, пользователь, встретившийся в обоих источниках, попадёт дважды и будет посчитан два раза. UNION возвращает объединение множеств без дублей, поэтому COUNT(*) по результату даст количество уникальных пользователей, которые были хотя бы в одном источнике.
Проверь себя · 1/3разбор после ответа
Запрос 1:
SELECT * FROM users u LEFT JOIN orders o ON o.user_id = u.id WHERE o.amount > 1000. Запрос 2: SELECT * FROM users u LEFT JOIN orders o ON o.user_id = u.id AND o.amount > 1000. Чем отличаются результаты?Ещё вопросы по теме «JOIN и операции множеств»
- В отчёте нужно вывести всех пользователей и количество их заказов, включая тех, у кого заказов нет. Какой тип соединения между `users` и `orders` по `user_id` нужен?
- Нужно посчитать число пользователей, которые сделали хотя бы 1 заказ (таблицы `users(user_id)` и `orders(user_id, order_id)`). Какой запрос посчитает правильно?
- Вы соединили `orders` с `order_items` и `payments` по `order_id`, а затем посчитали `SUM(paid_amount)`. Сумма оказалась завышенной. Что вероятнее всего произошло и как исправить?
- Есть две таблицы с одинаковой схемой: `events_web(user_id, event_name, created_at)` и `events_app(user_id, event_name, created_at)`. Нужно получить общий поток событий для дальнейшей агрегации. Что использовать?
- Нужно получить уникальный список `user_id`, которые пришли из двух каналов: `campaign_a(user_id)` и `campaign_b(user_id)`. Как корректнее объединить списки, чтобы убрать дубликаты?
- Все вопросы по «JOIN и операции множеств» →