Нужно вывести пользователей, у которых есть хотя бы один заказ. У каждого пользователя может быть много заказов. Какой способ не создаст дублирование строк?
AНаписать
WHERE EXISTS (SELECT 1 FROM orders o WHERE o.user_id = u.id) — остановится на первом совпаденииBНаписать
INNER JOIN orders o ON o.user_id = u.id — вернёт ровно по одной строке на пользователяCНаписать
WHERE u.id IN (SELECT DISTINCT user_id FROM orders) — DISTINCT ускоряет поиск по индексуDНаписать
INNER JOIN (SELECT user_id FROM orders LIMIT 1) o ON o.user_id = u.id — ограничит результатПравильный ответ.
EXISTS проверяет наличие хотя бы одной строки и не дублирует результат, тогда как INNER JOIN создаст по строке на каждый заказ.Разбор
EXISTS (подзапрос) — это полусоединение (semi-join): для каждого пользователя проверяется, существует ли хотя бы одна строка в orders, и поиск прекращается при первом совпадении. Результат — ровно одна строка на пользователя. INNER JOIN без предварительной дедупликации orders создаст столько строк, сколько заказов у пользователя. IN тоже работает корректно, но DISTINCT внутри не «быстрее индекса».
Проверь себя · 1/3разбор после ответа
Нужно посчитать число пользователей, которые сделали хотя бы 1 заказ (таблицы
users(user_id) и orders(user_id, order_id)). Какой запрос посчитает правильно?Ещё вопросы по теме «JOIN и операции множеств»
- В отчёте нужно вывести всех пользователей и количество их заказов, включая тех, у кого заказов нет. Какой тип соединения между `users` и `orders` по `user_id` нужен?
- Нужно посчитать число пользователей, которые сделали хотя бы 1 заказ (таблицы `users(user_id)` и `orders(user_id, order_id)`). Какой запрос посчитает правильно?
- Вы соединили `orders` с `order_items` и `payments` по `order_id`, а затем посчитали `SUM(paid_amount)`. Сумма оказалась завышенной. Что вероятнее всего произошло и как исправить?
- Есть две таблицы с одинаковой схемой: `events_web(user_id, event_name, created_at)` и `events_app(user_id, event_name, created_at)`. Нужно получить общий поток событий для дальнейшей агрегации. Что использовать?
- Нужно получить уникальный список `user_id`, которые пришли из двух каналов: `campaign_a(user_id)` и `campaign_b(user_id)`. Как корректнее объединить списки, чтобы убрать дубликаты?
- Все вопросы по «JOIN и операции множеств» →