Question 1

В `EXPLAIN` вашего отчёта видно, что выполняется `Sort` по `created_at` на очень большом наборе строк. Какое действие чаще всего помогает уменьшить работу сортировки?

Accepted Answer

Сортировка ускоряется, если база может получить строки уже в нужном порядке из индекса. Если план вынужден делать `Sort` по миллионам строк, это часто главный потребитель ресурсов. Индекс по полю из `ORDER BY` (или составной индекс под фильтр + порядок) позволяет избежать полной сортировки или существенно её удешевить. Альтернативно можно уменьшить вход в сортировку через более точный `WHERE`.

Question 2

Есть запрос `SELECT * FROM events WHERE user_id = 42 ORDER BY created_at DESC LIMIT 50`. Какой вариант индекса чаще всего помогает, чтобы избежать `Sort` и быстро получить первые строки?

Accepted Answer

Составной индекс может одновременно поддержать фильтр и порядок сортировки. Когда запрос фильтрует по `user_id` и сортирует по `created_at`, составной индекс по `(user_id, created_at)` часто позволяет читать нужный диапазон уже упорядоченным. Тогда планировщик может выбрать `Index Scan` и применить `Limit` почти сразу, без отдельного шага `Sort`. Это типичный паттерн для «последние N событий пользователя».

Question 3

В отчёте для проверки качества данных вы используете `SELECT user_id FROM users LIMIT 100` и замечаете, что набор пользователей меняется между запусками. Почему это ожидаемо?

Accepted Answer

`LIMIT` без `ORDER BY` не даёт стабильного набора строк. SQL по умолчанию не гарантирует порядок строк, если вы явно не указали `ORDER BY`. Поэтому `LIMIT` просто обрезает «как получилось» — порядок может зависеть от плана выполнения, физического расположения строк и других факторов. Если нужен воспроизводимый результат, добавьте детерминирующий `ORDER BY` (часто по ключу).

Question 4

Вы видите `Index Scan` в `EXPLAIN` и делаете вывод «это точно быстро». Насколько это корректно?

Accepted Answer

`EXPLAIN` без `ANALYZE` показывает оценки планировщика, а `Index Scan` не всегда быстрее `Seq Scan`. Индексы помогают выборочным запросам, но при больших выборках последовательное чтение часто оказывается быстрее. `EXPLAIN` без `ANALYZE` не измеряет фактическое время — это модельная оценка стоимости. Поэтому план — это гипотеза о работе запроса, которую нужно проверять на реальных данных, особенно для критичных дашбордов.

Question 5

Вы смотрите `EXPLAIN` запроса для дашборда и видите фрагмент: `Sort` → `Limit`. При этом сортировка происходит по миллионам строк. Где с наибольшей вероятностью узкое место?

Accepted Answer

Часто дорого не `LIMIT`, а сортировка перед ним: `Sort` обходит весь набор, если нет подходящего индекса. Если нет индекса, который может отдать строки уже в нужном порядке, база вынуждена выполнять `Sort` для всего набора, а затем брать первые строки через `Limit`. Поэтому для ускорения обычно уменьшают объём данных до сортировки более селективным `WHERE` или добавляют индекс под `ORDER BY`. Сам `Limit` после готовой сортировки обычно дешёвый, а сетевая передача редко лимитирует результат, ограниченный десятками строк.

EXPLAIN и оптимизация: вопросы для собеседования (часть 3)

Вопросы 11–15 из 20

Хотите тренировать интерактивно?

Другие темы: SQL