Нужно получить одну строку на пользователя: users(user_id) + время последнего события из events(user_id, created_at). Что лучше всего сделать, чтобы JOIN не вернул несколько строк на одного пользователя?

AСделать LEFT JOIN users на events по user_id и ничего больше — дубликатов не будет.
BСначала агрегировать events до одной строки на user_id (например, MAX(created_at)), затем сделать LEFT JOIN этого результата к users.
CЗаменить соединение на UNION, чтобы строки «склеились».
DИспользовать FULL JOIN, он автоматически убирает дубликаты.
Правильный ответ. Если справа несколько событий на пользователя, то обычный JOIN даст несколько строк; типичный выход — предварительно агрегировать правую таблицу до нужного уровня.

Разбор

events обычно содержит много строк на одного пользователя. При JOIN каждая из них соединится с одной строкой из users, и вы получите дубликаты пользователей. Чтобы сохранить гранулярность «одна строка на пользователя», сначала посчитайте последнюю дату события на уровне user_id (например, через MAX(created_at) с GROUP BY user_id), а затем соединяйте с users.

Проверь себя · 1/3разбор после ответа
Есть payments(user_id) и refunds(user_id). Нужно получить пользователей, у которых был платёж, но не было возврата. Какой вариант корректнее всего описывает задачу?
Тренировать SQL в Telegram

Ещё вопросы по теме «JOIN и операции множеств»