Первый набор содержит значения: 100, 100, 100, 200. Второй набор: 100, 300. Чем отличаются результаты EXCEPT и EXCEPT ALL?
A
EXCEPT вернёт {200}, а EXCEPT ALL вернёт {100, 100, 200} — три строки с учётом кратностиBОба запроса вернут одинаковый результат: одну строку со значением
200 без дубликатовCОба запроса вернут
{100, 100, 200}, потому что оператор вычитания не убирает дубликатыD
EXCEPT вернёт {100, 200}, а EXCEPT ALL вернёт пустой результат из-за пересеченияПравильный ответ.
EXCEPT дедуплицирует и вычитает множества — вернёт только {200}. EXCEPT ALL учитывает кратность: из 3 копий 100 вычтёт 1, оставит {100, 100, 200}.Разбор
EXCEPT работает как множественное вычитание: сначала дедуплицирует оба набора, затем убирает совпадения. Уникальные в первом: {100, 200}, 100 есть во втором — остаётся {200}. EXCEPT ALL работает по кратности: 3 копии 100 минус 1 копия 100 = 2 копии 100, плюс 200 = {100, 100, 200}. Это аналогично разнице между UNION и UNION ALL.
Проверь себя · 1/3разбор после ответа
Вы объединяете логи событий из двух источников
events_web и events_app, чтобы посчитать количество событий. Важно не потерять повторяющиеся события (например, два одинаковых клика). Что лучше использовать для объединения?Ещё вопросы по теме «JOIN и операции множеств»
- В отчёте нужно вывести всех пользователей и количество их заказов, включая тех, у кого заказов нет. Какой тип соединения между `users` и `orders` по `user_id` нужен?
- Нужно посчитать число пользователей, которые сделали хотя бы 1 заказ (таблицы `users(user_id)` и `orders(user_id, order_id)`). Какой запрос посчитает правильно?
- Вы соединили `orders` с `order_items` и `payments` по `order_id`, а затем посчитали `SUM(paid_amount)`. Сумма оказалась завышенной. Что вероятнее всего произошло и как исправить?
- Есть две таблицы с одинаковой схемой: `events_web(user_id, event_name, created_at)` и `events_app(user_id, event_name, created_at)`. Нужно получить общий поток событий для дальнейшей агрегации. Что использовать?
- Нужно получить уникальный список `user_id`, которые пришли из двух каналов: `campaign_a(user_id)` и `campaign_b(user_id)`. Как корректнее объединить списки, чтобы убрать дубликаты?
- Все вопросы по «JOIN и операции множеств» →