Вы соединяете users и orders по user_id, где у пользователя может быть много заказов (one-to-many). Как посчитать число пользователей, которые сделали хотя бы один заказ, чтобы избежать duplication?
AПосчитать
COUNT(*) после JOINBПосчитать
COUNT(DISTINCT user_id) после JOINCПосчитать
SUM(order_id) после JOINDПосчитать
AVG(order_amount) после JOINПравильный ответ. В
one-to-many соединении COUNT(*) считает строки заказов, поэтому для пользователей нужен distinct по user_id.Разбор
После JOIN каждая покупка создаёт отдельную строку, поэтому пользователи с несколькими заказами появляются несколько раз — это duplication. Чтобы получить число уникальных пользователей, нужно считать уникальные user_id, например COUNT(DISTINCT user_id). Этот же принцип полезен и для других метрик, где единица анализа — пользователь.
Проверь себя · 1/3разбор после ответа
Вы хотите добавить к
orders атрибут category из таблицы products(product_id, category) и не изменить количество строк заказов. Что важнее всего проверить про products, чтобы избежать duplication?Ещё вопросы по теме «JOIN и кардинальность»
- В таблице `users` 100 000 строк, в таблице `user_profiles` — ровно одна строка на каждого `user_id`. Вы делаете `INNER JOIN` по `user_id`. Что верно про число строк результата?
- Для одного `order_id` в `order_items` есть 3 строки, а в `payments` есть 2 строки. Вы соединили всё в одну таблицу по `order_id` без предварительной агрегации. Сколько строк получится для этого заказа и почему?
- Нужен датасет на уровне `user_id`: выручка из `orders` и число сессий из `sessions`. В обеих таблицах по пользователю много строк (`one-to-many`). Какой подход минимизирует риск `join explosion`?
- Вы хотели посчитать средний чек по заказам как `AVG(order_total)`. Но перед этим соединили `orders` с `order_items` по `order_id` (`one-to-many`). Почему `AVG()` может измениться по сравнению с расчётом на таблице `orders`?
- В каком случае `SUM(order_amount)` после `JOIN` скорее всего останется корректным, без эффекта `duplication`?
- Все вопросы по «JOIN и кардинальность» →