如果要将结果存储在另一个数据集中:
df.drop_duplicates(keep=False)
或
df.drop_duplicates(keep=False, inplace=False)
如果需要更新同一数据集:
df.drop_duplicates(keep=False, inplace=True)
以上示例将删除所有重复项并保留一个,类似于 DISTINCT * 在SQL中
DISTINCT *