Py学习  »  Python

如何使用pivot表python创建重复行

Sai Sumanth • 4 年前 • 686 次点击  

我想在python中为dataframe创建重复的行。数据帧如下所示

SKU Ids wk_1 wk_2 wk_3 wk_4 wk_5 wk_6    

 10 20  1    2    3     4    5    6
 30 40  6    5    4     3    2    1

我希望输出为

SKU Ids wk   value
 10 20 wk_1   1
 10 20 wk_2   2
 10 20 wk_3   3
 10 20 wk_4   4
 10 20 wk_5   5
 10 20 wk_6   6
 30 40 wk_1   6
 30 40 wk_2   5
 30 40 wk_3   4
 30 40 wk_4   3
 30 40 wk_5   2
 30 40 wk_6   1

我试图使用pivot_表,但它显示了错误

hqp = hq.pivot_table(columns=['sku', 'ids','value'], 
index= ['sku', 'ids'], 
values = ['wk_1', 'wk_2', 'wk_3', 'wk_4','wk_5', 'wk_6'])
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/39931
 
686 次点击  
文章 [ 2 ]  |  最新文章 4 年前
Sandeep Kadapa
Reply   •   1 楼
Sandeep Kadapa    5 年前

集合 SKU Ids 作为索引和 stack 然后 reset_index rename :

df = df.set_index(['SKU','Ids'])\
       .stack().reset_index()\
       .rename(columns={'level_2':'wk',0:'value'})

或:

df = df.set_index(['SKU','Ids'])\
       .stack().reset_index(name='value')\
       .rename(columns={'level_2':'wk'})

或根据 W-B 建议在评论中再使用一种方法 melt sort_values :

df = df.melt(id_vars=['SKU','Ids'])\
       .rename(columns={'variable':'wk'})\
       .sort_values(['SKU','Ids'])

print(df)
    SKU  Ids    wk  value
0    10   20  wk_1      1
1    10   20  wk_2      2
2    10   20  wk_3      3
3    10   20  wk_4      4
4    10   20  wk_5      5
5    10   20  wk_6      6
6    30   40  wk_1      6
7    30   40  wk_2      5
8    30   40  wk_3      4
9    30   40  wk_4      3
10   30   40  wk_5      2
11   30   40  wk_6      1
WeNYoBen
Reply   •   2 楼
WeNYoBen    5 年前

这就是为什么 wide_to_long 建立

pd.wide_to_long(df,['wk'],i=['SKU','Ids'],j='value',sep='_').reset_index()
Out[28]: 
    SKU  Ids  value  wk
0    10   20      1   1
1    10   20      2   2
2    10   20      3   3
3    10   20      4   4
4    10   20      5   5
5    10   20      6   6
6    30   40      1   6
7    30   40      2   5
8    30   40      3   4
9    30   40      4   3
10   30   40      5   2
11   30   40      6   1