Py学习  »  Python

以python大小和计数计算频率

user18309957 • 3 年前 • 1215 次点击  

我有一个数据框,看起来像这样:

Item       Year     
I1         2015
I2         2016
I1         2017
I2         2014

项目 I2 例如,在2016年和2014年售出

我想分组 Item Year 然后做什么 R 代码:

top_items <- data %>% select(Item, Year) %>%
  group_by(Year, Item) %>%
  summarize(sales_trend = n()) %>%
  arrange(desc(sales_trend))

也就是说,我必须对最畅销的商品进行分类。

我正在尝试以下Python代码:

b_data = pd.DataFrame(data[["Item", "Year"]].groupby(["Item", "Year"]).size()).sort_values(by=[0], ascending=False)

但我还有一个专栏 0 ,我想按它排序,但我不想调用该列 0 ,怎么叫 sales_trend 就像我的 R .

而且如果我想得到这个 Python 以下内容的等价性 R 这就完成了前面的工作,怎么做?

...
  arrange(desc(sales_trend))
  slice_head(n = 5) %>%
  mutate(Year = as.integer(Year), rank = 1:5) %>%
  select(-sales_trend)
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/133006
 
1215 次点击  
文章 [ 2 ]  |  最新文章 3 年前