Вы ищете пользователей без заказов запросом SELECT u.user_id FROM users u WHERE u.user_id NOT IN (SELECT o.user_id FROM orders o). Почему он может вернуть 0 строк и какой подход безопаснее?
A
NOT IN корректен на любых данных: разница только в скорости относительно NOT EXISTSB
NOT IN требует ORDER BY в подзапросе: без сортировки фильтр работает нестабильно и строки могут пропадатьC
NULL в подзапросе делает NOT IN равным UNKNOWN для всех строк: безопаснее использовать NOT EXISTS с корреляциейDЗамена
NOT IN на <> по списку значений исключает NULL из сравнения и даёт корректный набор строкПравильный ответ.
NOT EXISTS проверяет отсутствие связанных строк, а NOT IN чувствителен к NULL в списке значений и может обнулить выборку.Разбор
В трёхзначной логике SQL выражение x NOT IN (...) становится UNKNOWN, если в списке есть NULL, даже когда явного совпадения нет. В WHERE это означает, что строка не пройдёт фильтр, и итог может оказаться пустым. NOT EXISTS формулирует задачу иначе: «нет ни одной строки, удовлетворяющей связи и условию», и поэтому надёжнее для анти-джойна. Замены через <> или ORDER BY проблему NULL не решают.
Проверь себя · 1/3разбор после ответа
Вы считаете метрику: доля пользователей, которые совершили покупку в течение 7 дней после регистрации. Какой вариант построения запроса делает логику наиболее проверяемой и удобной для отладки?
Ещё вопросы по теме «Подзапросы и CTE»
- В отчёте нужно посчитать выручку по странам пользователей только по оплаченным заказам за период, причём шаг «оплаченные за период» используется ещё в трёх соседних метриках. Какой подход обычно делает запрос проверяемее и позволяет переиспользовать фильтрацию?
- Вы выбираете пользователей, у которых есть хотя бы один платёж. В таблице `payments` поле `user_id` иногда бывает `NULL` (например, анонимные платежи). Почему в такой ситуации часто предпочитают `EXISTS`, а не `IN`?
- Вы пишете `SELECT u.user_id, (SELECT order_id FROM orders o WHERE o.user_id = u.user_id) AS last_order_id FROM users u`. Что может пойти не так и как исправить, чтобы подзапрос стал скалярным?
- Нужно выбрать заказы, у которых `amount` выше среднего `amount` по тому же пользователю. Какой вариант `WHERE` корректно использует коррелированный подзапрос?
- Дашборд содержит две метрики на одних и тех же продажах: топ товаров по выручке за период и общая выручка за тот же период. Витрина обновляется ежедневно, и важно, чтобы фильтр по периоду был один и тот же для обеих цифр. Какой подход надёжнее защищает от рассинхронизации?
- Все вопросы по «Подзапросы и CTE» →