社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Python

为什么我的python正则表达式锚不能在多行字符串上正常工作?

WordBrewery • 5 年前 • 1551 次点击  

我正在编写一个脚本来清理从PDF转换的文本文件。出于某种原因,锚角色 ^ $ (匹配字符串的开头和结尾)在正则表达式中似乎无法正常工作。我在Linux上使用Python3.6.6。

为什么是 ^Credits$ 与独立行不匹配 Credits 在下面的代码中?

>>> import re
>>> my_regex = r'^Credits$'
>>> my_string = "based upon extrinsic circumstances, as discussed in Serrano v. Priest, 20 Cal.3d 25, 49.\n\nCredits\n(Added by Stats.1977, c. 1197, p. 3979,  1. Amended by Stats.1993, c. 645 (S.B.764),  2.)"
>>> print(re.findall(my_regex,my_string))
[]

这是一段文字( my_string )如print()函数所示:

based upon extrinsic circumstances, as discussed in Serrano v. Priest, 20 Cal.3d 25, 49.

Credits
(Added by Stats.1977, c. 1197, p. 3979,  1. Amended by Stats.1993, c. 645 (S.B.764),  2.)

谢谢你的帮助。

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/39750
 
1551 次点击  
文章 [ 1 ]  |  最新文章 5 年前
U10-Forward
Reply   •   1 楼
U10-Forward    6 年前

AS @CertainPerformance 说,用 re.M 结束时的标志 findall :

print(re.findall(my_regex,my_string,re.M))

演示:

>>> import re
>>> my_regex = r'^Credits$'
>>> my_string = "based upon extrinsic circumstances, as discussed in Serrano v. Priest, 20 Cal.3d 25, 49.\n\nCredits\n(Added by Stats.1977, c. 1197, p. 3979,  1. Amended by Stats.1993, c. 645 (S.B.764),  2.)"
>>> print(re.findall(my_regex,my_string,re.M))
['Credits']

或与一起使用 r'(?m)^Credits$' :

>>> import re
>>> my_regex = r'(?m)^Credits$'
>>> my_string = "based upon extrinsic circumstances, as discussed in Serrano v. Priest, 20 Cal.3d 25, 49.\n\nCredits\n(Added by Stats.1977, c. 1197, p. 3979,  1. Amended by Stats.1993, c. 645 (S.B.764),  2.)"
>>> print(re.findall(my_regex,my_string,re.M))
['Credits']