Нужно посчитать долю каждой строки в сумме продаж своей группы по `store`: `share = sales / sum(sales)` внутри `store`. Какой вариант самый идиоматичный в `pandas`?

Question

Карьерник · Accepted Answer

Правильный ответ: `df["share"] = df["sales"] / df.groupby("store")["sales"].transform("sum")`. Для расчёта значений на уровне строк внутри групп используют `.transform()`, который сохраняет исходную длину `DataFrame`. `.transform("sum")` возвращает `Series` той же длины, что и исходный `DataFrame`, где каждой строке сопоставлена сумма её группы. Это позволяет делить `df["sales"]` поэлементно. Варианты с `.sum()` или `.mean()` без `transform()` дают агрегированный результат по группам и не совпадают по длине с исходными строками. `apply()` с обращением к `groupby` внутри лямбды работает медленно и непрозрачно, а ещё и считает не то — он применяет операцию к каждому скаляру.

Нужно посчитать долю каждой строки в сумме продаж своей группы по `store`: `share = sales / sum(sales)` внутри `store`. Какой вариант самый идиоматичный в `pandas`?

Разбор

Ещё вопросы по теме «Pandas и DataFrame»

Нужно посчитать долю каждой строки в сумме продаж своей группы по store: share = sales / sum(sales) внутри store. Какой вариант самый идиоматичный в pandas?

Разбор

Ещё вопросы по теме «Pandas и DataFrame»

Нужно посчитать долю каждой строки в сумме продаж своей группы по `store`: `share = sales / sum(sales)` внутри `store`. Какой вариант самый идиоматичный в `pandas`?