我有以下玩具数据框示例:
import pandas as pd
df = pd.DataFrame({'id': [0, 0, 0], 'key':['role', 'role', 'role'], 'val': ['admin', 'local_usr', 'fin_dep_ds']})
正如您可能看到的,同一个键有多个值。
当我转动桌子时
agg
我使用的函数是
",".join()
但最终目标是对这些值应用一种热编码:
pd.DataFrame(pd.pivot_table(df, \
values='val', \
index='id', \
columns='key', \
aggfunc=','.join).to_records())
最终目标:
id admin local_usr fin_dep_ds
0 1 1 1
请告诉我怎么做?有解决这种情况的最佳实践吗?