Question 1

Запрос использует `GROUP BY ROLLUP(region)`. В исходных данных есть строки с `region = NULL`. Как отличить суперагрегатную строку (итог по всем) от строки с реальным `NULL`-регионом?

Accepted Answer

`GROUPING(col)` возвращает 1 только для синтетических `NULL`, добавленных `ROLLUP`, и 0 для всех реальных данных, включая строки с реальным `NULL`. `GROUPING(expr)` — функция SQL:2003, которая возвращает 1, если `NULL` в данной строке является суперагрегатным маркером, и 0 для реальных значений (включая реальные `NULL`). `COALESCE(region, 'Итого')` не различает: он заменит и реальный `NULL`, и суперагрегат на одну строку. Правильный паттерн: `CASE WHEN GROUPING(region)=1 THEN 'Итог' ELSE COALESCE(region,'Нет региона') END`.

Question 2

Таблица `sales` содержит 2 уникальных значения в `region` и 2 уникальных значения в `channel`. Сколько максимум строк вернёт `SELECT region, channel, SUM(revenue) FROM sales GROUP BY CUBE(region, channel)`?

Accepted Answer

`CUBE(a, b)` генерирует все 4 подмножества: `(a,b)`, `(a)`, `(b)`, `()`. При 2 значениях в каждом поле получается 4+2+2+1=9 строк. `CUBE(a, b)` создаёт группировки для всех `2^n` подмножеств полей: `(a, b)`, `(a)`, `(b)`, `()`. При двух регионах и двух каналах: 4 пары + 2 строки по региону + 2 строки по каналу + 1 общий итог = 9. `ROLLUP(a, b)` генерирует только `(a, b)`, `(a)`, `()` — это 4+2+1=7 строк, без отдельной разбивки по `(b)`. `CUBE` перебирает все возможные комбинации, `ROLLUP` идёт иерархически справа налево.

Агрегация, GROUP BY и HAVING: вопросы для собеседования (часть 7)

Вопросы 31–32 из 32

Хотите тренировать интерактивно?

Другие темы: SQL