假设我有这个数据框:
df = pd.DataFrame({'col1': ['AC1', 'AC2', 'AC3', 'AC4', 'AC5'],
'col2': ['A', 'B', 'B', 'A', 'C'],
'col3': ['ABC', 'DEF', 'FGH', 'IJK', 'LMN']})
如果'col2'中的值重复,我想将'col3'的文本转换成行。结果应该是这样的:
col1 col2 col3
0 AC1 A ABC, IJK
1 AC2 B DEF, FGH
2 AC3 B DEF, FGH
3 AC4 A ABC, IJK
4 AC5 C LMN
我通过在此数据帧中查找重复的值开始此练习:
col2 = df['col2']
df1 = df[col2.isin(col2[col2.duplicated()])]
有什么建议我下一步该怎么做吗?