Question 1

Запрос фильтрует по `created_at > '2024-01-01'` и `SUM(amount) > 1000`. Как правильно расставить эти условия?

Accepted Answer

Неагрегированное условие `created_at` ставят в `WHERE` — оно уменьшает данные до группировки. Условие на агрегат `SUM(amount)` можно разместить только в `HAVING`. Логический порядок: `WHERE` → `GROUP BY` → `HAVING`. Условие на не-агрегированный столбец в `WHERE` отсекает строки до группировки — меньше данных обрабатывается. Условие `SUM(amount) > 1000` невозможно вынести в `WHERE`, так как агрегат ещё не вычислен на этом этапе — оно должно быть в `HAVING`. Размещение агрегатного условия в `WHERE` приведёт к синтаксической ошибке.

Question 2

Запрос: `SELECT dept, STRING_AGG(name, ', ') FROM employees GROUP BY dept`. Что вернёт `STRING_AGG` для каждого отдела?

Accepted Answer

`STRING_AGG(expr, delimiter)` конкатенирует все значения группы в одну строку, разделяя их указанным разделителем. `STRING_AGG(col, sep)` — агрегатная функция, которая склеивает строковые значения группы через разделитель `sep`. Порядок можно задать через `STRING_AGG(col, sep ORDER BY sort_col)`. Аналог в других СУБД: `GROUP_CONCAT` в MySQL, `LISTAGG` в Oracle. `ARRAY_AGG` делает то же самое, но возвращает PostgreSQL-массив, а не текстовую строку.

Question 3

Запрос: `SELECT dept, name, MAX(salary) FROM employees GROUP BY dept`. Что произойдёт в PostgreSQL?

Accepted Answer

PostgreSQL выдаст ошибку: каждый столбец в `SELECT` должен либо входить в `GROUP BY`, либо быть обёрнут агрегатом — `name` не соответствует ни одному условию. Стандарт SQL и PostgreSQL требуют, чтобы в `SELECT`-списке `GROUP BY`-запроса присутствовали только столбцы из `GROUP BY`, агрегатные функции или выражения, функционально зависимые от ключа группировки. `name` не входит в `GROUP BY dept`, поэтому PostgreSQL выдаст ошибку. MySQL в режиме без `ONLY_FULL_GROUP_BY` допустит запрос, но вернёт произвольное значение — недетерминированный результат.

Question 4

Запрос использует `ARRAY_AGG(product_name)` без `ORDER BY` внутри функции. Что верно о порядке элементов в массиве?

Accepted Answer

Без `ORDER BY` внутри `ARRAY_AGG` порядок элементов не определён стандартом и может меняться между запусками. Порядок строк внутри группы без явной сортировки зависит от плана выполнения, параллелизма и физического расположения данных. Стандарт SQL не гарантирует порядок без `ORDER BY`. Чтобы получить стабильный результат, пишут `ARRAY_AGG(product_name ORDER BY product_name)` или `ARRAY_AGG(product_name ORDER BY created_at)`. Внешний `ORDER BY` в `SELECT` упорядочивает строки результата, но не элементы внутри агрегата, а порядок вставки и первичный ключ напрямую не влияют на порядок чтения.

Question 5

Запрос: `SELECT dept, SUM(salary), RANK() OVER(ORDER BY SUM(salary) DESC) FROM employees GROUP BY dept`. Когда сработает оконная функция `RANK()`?

Accepted Answer

Оконные функции вычисляются после `GROUP BY` и `HAVING` — `RANK()` видит уже сгруппированные строки. Логический порядок выполнения SQL: `FROM` → `WHERE` → `GROUP BY` → `HAVING` → оконные функции → `SELECT` → `ORDER BY`. Поэтому `RANK() OVER(ORDER BY SUM(salary) DESC)` получает на вход результат группировки — по одной строке на отдел с вычисленной суммой — и ранжирует эти агрегированные строки. Оконная функция не может «заглянуть» в исходные строки внутри группы.

Агрегация, GROUP BY и HAVING: вопросы для собеседования (часть 5)

Вопросы 21–25 из 32

Хотите тренировать интерактивно?

Другие темы: SQL