Есть две таблицы с одинаковой схемой: events_web(user_id, event_name, created_at) и events_app(user_id, event_name, created_at). Нужно получить общий поток событий для дальнейшей агрегации. Что использовать?
A
INNER JOIN по user_idB
LEFT JOIN по user_idC
FULL JOIN по user_idD
UNION ALL между двумя выборкамиПравильный ответ.
UNION ALL «складывает» строки из двух источников вертикально; JOIN соединяет колонки горизонтально по ключу.Разбор
Когда нужно объединить записи одинакового формата из разных источников (web и app), применяют операции над наборами: UNION/UNION ALL. JOIN используется для добавления атрибутов по ключу и не предназначен для «склейки» двух логов событий в один поток. Обычно берут UNION ALL, чтобы не терять повторяющиеся события и не тратить время на удаление дублей.
Проверь себя · 1/3разбор после ответа
Аналитик переписал запрос, поменяв порядок таблиц в цепочке
JOIN. Запрос стал выполняться быстрее. Почему это могло произойти?Ещё вопросы по теме «JOIN и операции множеств»
- В отчёте нужно вывести всех пользователей и количество их заказов, включая тех, у кого заказов нет. Какой тип соединения между `users` и `orders` по `user_id` нужен?
- Нужно посчитать число пользователей, которые сделали хотя бы 1 заказ (таблицы `users(user_id)` и `orders(user_id, order_id)`). Какой запрос посчитает правильно?
- Вы соединили `orders` с `order_items` и `payments` по `order_id`, а затем посчитали `SUM(paid_amount)`. Сумма оказалась завышенной. Что вероятнее всего произошло и как исправить?
- Нужно получить уникальный список `user_id`, которые пришли из двух каналов: `campaign_a(user_id)` и `campaign_b(user_id)`. Как корректнее объединить списки, чтобы убрать дубликаты?
- Как переписать запрос без `RIGHT JOIN`, используя только `LEFT JOIN`? Исходный запрос: `SELECT u.user_id, o.order_id FROM users u RIGHT JOIN orders o ON u.user_id = o.user_id;`
- Все вопросы по «JOIN и операции множеств» →