Таблица sessions и таблица purchases содержат поля user_id и date. Нужно соединить данные так, чтобы каждой сессии соответствовала покупка того же пользователя в тот же день. Как корректнее всего записать JOIN?
AОба условия в
ON: ON a.user_id = b.user_id AND a.date = b.date для соединения по составному ключуBВ
ON оставить только a.user_id = b.user_id, а равенство дат вынести в WHERE: для LEFT JOIN результат отличаетсяCОба условия записать в
WHERE через запятую: WHERE a.user_id = b.user_id, a.date = b.date без раздела ONDВ
ON соединить по user_id, а условие на дату добавить в HAVING a.date = b.date после агрегации по датеПравильный ответ. Несколько условий соединения указываются в
ON через AND, например ON a.user_id = b.user_id AND a.date = b.date.Разбор
Если совпадение требуется по нескольким столбцам, все условия указываются в ON через AND. Это аналог соединения по составному ключу. Для INNER JOIN перенос условия в WHERE даёт тот же результат, но для LEFT JOIN — нет: условие в WHERE отфильтрует строки с NULL и превратит внешнее соединение во внутреннее. Поэтому условия соединения всегда указываются в ON.
Проверь себя · 1/3разбор после ответа
Есть таблицы
payments(user_id) и refunds(user_id). Нужно получить пользователей, у которых был платёж, но не было ни одного возврата. Какой запрос корректнее всего описывает задачу?Ещё вопросы по теме «JOIN и операции множеств»
- В отчёте нужно вывести всех пользователей и количество их заказов, включая тех, у кого заказов нет. Какой тип соединения между `users` и `orders` по `user_id` нужен?
- Нужно посчитать число пользователей, которые сделали хотя бы 1 заказ (таблицы `users(user_id)` и `orders(user_id, order_id)`). Какой запрос посчитает правильно?
- Вы соединили заказы с `order_items` и `payments` по `order_id`, а потом посчитали `SUM(paid_amount)`. Сумма оказалась завышенной. Что вероятнее всего произошло и как исправить?
- Есть две таблицы с одинаковой схемой: `events_web(user_id, event_name, created_at)` и `events_app(user_id, event_name, created_at)`. Нужно получить общий поток событий для дальнейшей агрегации. Что использовать?
- Нужно получить уникальный список идентификаторов пользователей из двух каналов: `campaign_a(user_id)` и `campaign_b(user_id)`. Как корректнее объединить списки, чтобы убрать дубликаты?
- Все вопросы по «JOIN и операции множеств» →