Продажи хранятся в двух таблицах: online_sales и offline_sales с одинаковой структурой. Нужно получить общую выручку по каждому продукту. Какой паттерн корректен?
AСоединить обе таблицы через
INNER JOIN по product_id и сложить суммы в одном SUMBНаписать два отдельных
SELECT с GROUP BY и объединить через UNION с дедупликациейCИспользовать
FULL OUTER JOIN по product_id — он автоматически сложит суммы из обеих таблицDОбъединить строки через
UNION ALL, затем сгруппировать и агрегировать общий результатПравильный ответ.
UNION ALL склеивает строки из обеих таблиц, а внешний GROUP BY с SUM считает общий итог: SELECT product_id, SUM(amount) FROM (...UNION ALL...) GROUP BY product_id.Разбор
Паттерн «UNION ALL + GROUP BY»: сначала UNION ALL объединяет сырые строки из нескольких источников, затем внешний SELECT с GROUP BY агрегирует. JOIN здесь не подходит — если продукт есть в обеих таблицах, INNER JOIN дублирует строки и завысит сумму. UNION (без ALL) удалит строки с одинаковыми суммами — тоже ошибка. FULL OUTER JOIN не складывает значения автоматически.
Проверь себя · 1/3разбор после ответа
Есть
payments(user_id) и refunds(user_id). Нужно получить пользователей, у которых был платёж, но не было возврата. Какой вариант корректнее всего описывает задачу?Ещё вопросы по теме «JOIN и операции множеств»
- В отчёте нужно вывести всех пользователей и количество их заказов, включая тех, у кого заказов нет. Какой тип соединения между `users` и `orders` по `user_id` нужен?
- Нужно посчитать число пользователей, которые сделали хотя бы 1 заказ (таблицы `users(user_id)` и `orders(user_id, order_id)`). Какой запрос посчитает правильно?
- Вы соединили `orders` с `order_items` и `payments` по `order_id`, а затем посчитали `SUM(paid_amount)`. Сумма оказалась завышенной. Что вероятнее всего произошло и как исправить?
- Есть две таблицы с одинаковой схемой: `events_web(user_id, event_name, created_at)` и `events_app(user_id, event_name, created_at)`. Нужно получить общий поток событий для дальнейшей агрегации. Что использовать?
- Нужно получить уникальный список `user_id`, которые пришли из двух каналов: `campaign_a(user_id)` и `campaign_b(user_id)`. Как корректнее объединить списки, чтобы убрать дубликаты?
- Все вопросы по «JOIN и операции множеств» →