Что верно про pd.merge(orders, customers, on="customer_id", how="left")?
AВ результате останутся только те заказы, у которых есть клиент в
customers (inner join)BВ результате останутся все клиенты, даже если у них нет заказов
CВ результате останутся все строки из
orders, а поля из customers будут NaN, если совпадение по customer_id не найденоDPandas автоматически удалит дубликаты
customer_id перед объединениемПравильный ответ. Left join сохраняет все строки из левой таблицы и добавляет данные из правой по ключу.
Разбор
В how="left" левая таблица — это orders, поэтому каждая строка заказа попадёт в результат. Для каждого заказа pandas пытается найти строку в customers с тем же customer_id. Если совпадения нет, колонки из customers заполняются NaN. Это типичный паттерн для обогащения фактов (заказов) атрибутами (клиентов).
Проверь себя · 1/3разбор после ответа
Какое выражение гарантированно вернёт
DataFrame (а не Series) при выборе одного столбца col?Ещё вопросы по теме «Pandas и DataFrame»
- Что вернёт выражение `df[df["price"] > 100]`?
- В `DataFrame` `df` есть столбцы `country`, `user_id`, `revenue`. Что вернёт выражение `df.loc[df["country"] == "RU", ["user_id", "revenue"]]`?
- В `df` есть столбец `age`. Какие значения `age` попадут в результат `df[(df["age"] >= 18) & (df["age"] <= 25)]`?
- Что выберет фильтр `df[~df["status"].isin(["cancelled", "returned"])]`?
- Что верно про два шага: `mask = df["col"] > 0` и затем `df[mask]`?
- Все вопросы по «Pandas и DataFrame» →