СУБД не поддерживает FULL OUTER JOIN (например, MySQL версии до 8.0). Как корректно эмулировать его для сверки таблиц system_a и system_b по product_id?
AНаписать
LEFT JOIN и заменить NULL через COALESCE: такой приём заявляется как полный аналог FULL OUTER JOINBНаписать
CROSS JOIN и отфильтровать несовпадающие строки в WHERE: такой приём предлагают как замену соединенияCНаписать
LEFT JOIN для совпадений плюс RIGHT JOIN с условием WHERE a.id IS NULL, объединённые через UNION ALLDНаписать только
INNER JOIN по product_id и считать его эквивалентом FULL OUTER JOIN: совпавшие строки уже включеныПравильный ответ. Эмуляция:
LEFT JOIN плюс UNION ALL со строками только из system_b (правое анти-соединение).Разбор
Классический способ: SELECT * FROM a LEFT JOIN b USING(id) UNION ALL SELECT * FROM a RIGHT JOIN b USING(id) WHERE a.id IS NULL. Первая часть даёт все строки из a со совпадениями из b. Вторая — только строки из b без пары. UNION ALL сохраняет все строки без дедупликации. LEFT JOIN с COALESCE теряет строки, которые есть только в b. CROSS JOIN со фильтром даёт декартово произведение, а не сверку. Один INNER JOIN теряет несовпавшие строки с обеих сторон.
Проверь себя · 1/3разбор после ответа
Нужно получить уникальный список идентификаторов пользователей из двух каналов:
campaign_a(user_id) и campaign_b(user_id). Как корректнее объединить списки, чтобы убрать дубликаты?Ещё вопросы по теме «JOIN и операции множеств»
- В отчёте нужно вывести всех пользователей и количество их заказов, включая тех, у кого заказов нет. Какой тип соединения между `users` и `orders` по `user_id` нужен?
- Нужно посчитать число пользователей, которые сделали хотя бы 1 заказ (таблицы `users(user_id)` и `orders(user_id, order_id)`). Какой запрос посчитает правильно?
- Вы соединили заказы с `order_items` и `payments` по `order_id`, а потом посчитали `SUM(paid_amount)`. Сумма оказалась завышенной. Что вероятнее всего произошло и как исправить?
- Есть две таблицы с одинаковой схемой: `events_web(user_id, event_name, created_at)` и `events_app(user_id, event_name, created_at)`. Нужно получить общий поток событий для дальнейшей агрегации. Что использовать?
- Нужно получить уникальный список идентификаторов пользователей из двух каналов: `campaign_a(user_id)` и `campaign_b(user_id)`. Как корректнее объединить списки, чтобы убрать дубликаты?
- Все вопросы по «JOIN и операции множеств» →