我正在编写一个脚本来清理从PDF转换的文本文件。出于某种原因,锚角色
^
和
$
(匹配字符串的开头和结尾)在正则表达式中似乎无法正常工作。我在Linux上使用Python3.6.6。
为什么是
^Credits$
与独立行不匹配
Credits
在下面的代码中?
>>> import re
>>> my_regex = r'^Credits$'
>>> my_string = "based upon extrinsic circumstances, as discussed in Serrano v. Priest, 20 Cal.3d 25, 49.\n\nCredits\n(Added by Stats.1977, c. 1197, p. 3979, 1. Amended by Stats.1993, c. 645 (S.B.764), 2.)"
>>> print(re.findall(my_regex,my_string))
[]
这是一段文字(
my_string
)如print()函数所示:
based upon extrinsic circumstances, as discussed in Serrano v. Priest, 20 Cal.3d 25, 49.
Credits
(Added by Stats.1977, c. 1197, p. 3979, 1. Amended by Stats.1993, c. 645 (S.B.764), 2.)
谢谢你的帮助。