我有一个数据框,看起来像这样:
Item Year
I1 2015
I2 2016
I1 2017
I2 2014
项目
I2
例如,在2016年和2014年售出
我想分组
Item
和
Year
然后做什么
R
代码:
top_items <- data %>% select(Item, Year) %>%
group_by(Year, Item) %>%
summarize(sales_trend = n()) %>%
arrange(desc(sales_trend))
也就是说,我必须对最畅销的商品进行分类。
我正在尝试以下Python代码:
b_data = pd.DataFrame(data[["Item", "Year"]].groupby(["Item", "Year"]).size()).sort_values(by=[0], ascending=False)
但我还有一个专栏
0
,我想按它排序,但我不想调用该列
0
,怎么叫
sales_trend
就像我的
R
.
而且如果我想得到这个
Python
以下内容的等价性
R
这就完成了前面的工作,怎么做?
...
arrange(desc(sales_trend))
slice_head(n = 5) %>%
mutate(Year = as.integer(Year), rank = 1:5) %>%
select(-sales_trend)