私信  •  关注

SA12345

SA12345 最近创建的主题
SA12345 最近回复了
6 年前
回复了 SA12345 创建的主题 » 如何使用python删除重复的文本块

您可以通过执行以下操作来查找所有出现的患者数据的起始索引:

str.find(sub,start,end)

哪里

sub:它是需要在给定字符串中搜索的子字符串——在您的情况下,它将是患者数据 开始:需要在字符串中检查sub的开始位置 结束:需要在字符串中检查后缀的结束位置

它将返回搜索字符串出现的最低索引(患者数据)。

您可以在一个循环中执行此过程,以获取发生患者数据的所有索引。

然后,您可以通过执行以下操作替换从第二个实例开始的患者数据:

str_new = ''.join(( str_old[ : indicies[1] ], '' , s_old[ indicies[2] + len(str_old) + 1 : ] ))
  ... assuming a total of 3 pages in your record.

其他选择:

str.replace(old, new [, max])

哪里

旧的:这是要替换的旧子字符串——在您的案例中是患者数据
新的:这是新的子字符串,它将替换旧的子字符串——它可以是“”(空白) max:如果给出了这个可选参数max,则只替换第一次出现的计数——这意味着患者数据现在将出现在 最后的 仅页。