У пользователя бывают несколько событий с одинаковым event_time (например, батч-логирование). Вы используете LAG(event_type) OVER (PARTITION BY user_id ORDER BY event_time) чтобы получить предыдущее событие. Как сделать результат стабильным при совпадениях по времени?
AДобавить
PARTITION BY event_timeBУбрать
ORDER BY event_time, тогда «предыдущее» будет определеноCЗаменить
LAG на RANK и брать строки, где rank = 2DДобавить в
ORDER BY второй ключ-тай-брейкер (например event_id) вместе с event_time, чтобы порядок был детерминированнымПравильный ответ. Если
ORDER BY не уникален, добавьте тай-брейкер (уникальный ключ) в сортировку окна.Разбор
LAG определяет «предыдущую строку» только через порядок ORDER BY внутри OVER. Если event_time не уникален, порядок строк с одинаковым временем может быть произвольным, и тогда «предыдущее событие» будет нестабильным. Решение — сделать сортировку детерминированной: добавить уникальный ключ события как тай-брейкер, например ORDER BY event_time, event_id.
Проверь себя · 1/3разбор после ответа
Вы делаете рейтинг товаров по выручке внутри категории. Если два товара делят 2 место, следующий товар должен получить 3 место (без пропуска). Какая функция подходит лучше всего?
Ещё вопросы по теме «Оконные функции»
- В одной категории 4 товара с выручкой 100, 100, 90 и 80. Вычисляем `RANK() OVER (ORDER BY revenue DESC)`. Какие ранги будут у строк, если упорядочить товары по убыванию выручки?
- Вы ищете последнюю транзакцию пользователя, используя `ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY paid_at DESC)` и оставляя `row_number = 1`. Что верно, если у пользователя две транзакции с одинаковым `paid_at`?
- Вы делаете рейтинг товаров по выручке внутри категории. Если два товара делят 2 место, следующий товар должен получить 3 место (без пропуска). Какая функция подходит лучше всего?
- В каждой категории нужно выбрать товары с тремя наибольшими различными значениями `revenue`, включая все товары, которые делят эти значения (при равных значениях). Какой вариант даст нужный результат?
- Нужно пронумеровать заказы каждого пользователя по времени покупки, начиная с 1, чтобы потом найти 1-й, 2-й, 3-й заказ. Какое выражение подходит?
- Все вопросы по «Оконные функции» →