В таблицах orders и users есть одноимённые столбцы: user_id, updated_at, status. Аналитик пишет SELECT * FROM orders NATURAL JOIN users. Что произойдёт?
AСоединение произойдёт только по
user_id, как задумано аналитиком при написании запросаBЗапрос вернёт ошибку, потому что
NATURAL JOIN не поддерживается в PostgreSQL на таблицахCСоединение произойдёт по столбцу
id из обеих таблиц — NATURAL JOIN берёт первый столбецDСоединение произойдёт по всем одноимённым столбцам:
user_id, updated_at и statusПравильный ответ.
NATURAL JOIN автоматически соединяет по всем столбцам с одинаковыми именами — здесь по user_id, updated_at и status, что почти наверняка не то, что нужно.Разбор
NATURAL JOIN находит все пары одноимённых столбцов и использует их как условие ON. Если помимо user_id совпадают updated_at и status, соединение потребует совпадения всех трёх — это резко сократит результат или вернёт пустую таблицу. Добавление нового столбца с тем же именем в любую таблицу молча сломает запрос. Поэтому NATURAL JOIN считается опасным в продакшне.
Проверь себя · 1/3разбор после ответа
Первый набор содержит значения:
100, 100, 100, 200. Второй набор: 100, 300. Чем отличаются результаты EXCEPT и EXCEPT ALL?Ещё вопросы по теме «JOIN и операции множеств»
- В отчёте нужно вывести всех пользователей и количество их заказов, включая тех, у кого заказов нет. Какой тип соединения между `users` и `orders` по `user_id` нужен?
- Нужно посчитать число пользователей, которые сделали хотя бы 1 заказ (таблицы `users(user_id)` и `orders(user_id, order_id)`). Какой запрос посчитает правильно?
- Вы соединили `orders` с `order_items` и `payments` по `order_id`, а затем посчитали `SUM(paid_amount)`. Сумма оказалась завышенной. Что вероятнее всего произошло и как исправить?
- Есть две таблицы с одинаковой схемой: `events_web(user_id, event_name, created_at)` и `events_app(user_id, event_name, created_at)`. Нужно получить общий поток событий для дальнейшей агрегации. Что использовать?
- Нужно получить уникальный список `user_id`, которые пришли из двух каналов: `campaign_a(user_id)` и `campaign_b(user_id)`. Как корректнее объединить списки, чтобы убрать дубликаты?
- Все вопросы по «JOIN и операции множеств» →