Py学习  »  Python

python trim帮助变量(单括号和双括号)

user263504 • 4 年前 • 609 次点击  

我的零碎代码给我回了条短信--

<img src="//d30v2pzvrfyzpo.cloudfront.net/uk/images/restaurants/65115.gif" itemprop="image" alt="Gourmet Sushi" width="100" height="100" onerror="this.onerror = null;this.src = '//dy3erx8o0a6nh.cloudfront.net/images/serp/serp_default_logo.svg';">

如何修剪它 src="// " 是的。

我对python很陌生。

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/48110
 
609 次点击  
文章 [ 2 ]  |  最新文章 4 年前
Matt
Reply   •   1 楼
Matt    5 年前

你应该使用python regexp . 下面是python解释器的一个例子。试试看,如果符合你的需要就接受。

>>> import re
>>> s = '<img src="//d30v2pzvrfyzpo.cloudfront.net/uk/images/restaurants/65115.gif" itemprop="image" alt="Gourmet Sushi" width="100" height="100" onerror="this.onerror = null;this.src = \'//dy3erx8o0a6nh.cloudfront.net/images/serp/serp_default_logo.svg\';">'
>>> pattern = re.compile(r'<img\s+src="//([^"]+)".*')
>>> for i in pattern.findall(s):
...     print(i)

d30v2pzvrfyzpo.cloudfront.net/uk/images/restaurants/65115.gif
vezunchik
Reply   •   2 楼
vezunchik    5 年前

检查这个片段。您可以将regexp应用于选择器:

>>> from scrapy import Selector
>>> txt = """<img src="//d30v2pzvrfyzpo.cloudfront.net/uk/images/restaurants/65115.gif" itemprop="image" alt="Gourmet Sushi" width="100" height="100" onerror="this.onerror = null;this.src = '//dy3erx8o0a6nh.cloudfront.net/images/serp/serp_default_logo.svg';">"""
>>> sel = Selector(text=txt)
>>> sel.re("src\s?=\s?['\"]([^'\"]+)['\"]")
[u'//d30v2pzvrfyzpo.cloudfront.net/uk/images/restaurants/65115.gif', u'//dy3erx8o0a6nh.cloudfront.net/images/serp/serp_default_logo.svg']

所以,然后你可以 [response.urljoin(url) for url in sel.re("src\s?=\s?['\"]([^'\"]+)['\"]")]