Py学习  »  Python

Python正则表达式单词bounaries

Bryan • 5 年前 • 283 次点击  

您好,我有一个下面这样的文本字符串,我正在尝试使用正则表达式来提取销售总量,该总量可以在销售总额43之后的新行后面找到,例如43将是销售总额。我正在使用以下命令,但我想删除总销售额和数量,只保留数量。我想知道我该怎么做,或者我需要做额外的处理。谢谢

'\ufeffSacramento Association of REALTORS®\nSingle Family Home Sales by ZIP CODE\nJanuary 2020\nZip        
 Code\nCurrent Month\nLast Month\nLast Year\nYear-to-Date\nTotal Sales\n43\nREO  
 Sales\n0\n45\n40\n43\nMedian Sales Price\n$417,000\n$0\n$410,000\n$400,000\n$417,000\nAverage    
 Price/Square Foot\n$268\nShort Sales\n0\n$253\n$239\nN/A\nAverage Sq Ft of  
 Property\n1,769\n$0\n1,746\n1,843\nN/A\nTotal Listing Inventory 
 *\n69\nConventional\n43\n65\n90\nN/A\nTotal Listing Median Price 
 ∞\n$612,475\nSales\n$417,000\n$574,900\n$547,475\nN/A\nTotal Sales\n29\nREO 
 **strong text**Sales\n0\n37\n16\n29\nMedian Sales Price\n$369,000

 total_sales = re.findall(r'\bTotal Sales\n\d{2}',data)

返回:

 ['Total Sales\n43',
 'Total Sales\n29',
 'Total Sales\n29',
 'Total Sales\n32',
 'Total Sales\n30',
 'Total Sales\n52',    
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/54883
 
283 次点击  
文章 [ 2 ]  |  最新文章 5 年前
Eraklon
Reply   •   1 楼
Eraklon    5 年前

用积极的眼光看后面: (?<=Total Sales\n)\d{2} Total Sales\n 字符串在模式前面 \d{2} . 只有抓住它。

jawad-khan
Reply   •   2 楼
jawad-khan    5 年前

这对你有用:

re.findall(r'\bTotal Sales\n(\d*)',data)