社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Python

python trim帮助变量(单括号和双括号)

user263504 • 4 年前 • 630 次点击  

我的零碎代码给我回了条短信--

<img src="//d30v2pzvrfyzpo.cloudfront.net/uk/images/restaurants/65115.gif" itemprop="image" alt="Gourmet Sushi" width="100" height="100" onerror="this.onerror = null;this.src = '//dy3erx8o0a6nh.cloudfront.net/images/serp/serp_default_logo.svg';">

如何修剪它 src="// " 是的。

我对python很陌生。

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/48110
 
630 次点击  
文章 [ 2 ]  |  最新文章 4 年前
Matt
Reply   •   1 楼
Matt    5 年前

你应该使用python regexp . 下面是python解释器的一个例子。试试看,如果符合你的需要就接受。

>>> import re
>>> s = '<img src="//d30v2pzvrfyzpo.cloudfront.net/uk/images/restaurants/65115.gif" itemprop="image" alt="Gourmet Sushi" width="100" height="100" onerror="this.onerror = null;this.src = \'//dy3erx8o0a6nh.cloudfront.net/images/serp/serp_default_logo.svg\';">'
>>> pattern = re.compile(r'<img\s+src="//([^"]+)".*')
>>> for i in pattern.findall(s):
...     print(i)

d30v2pzvrfyzpo.cloudfront.net/uk/images/restaurants/65115.gif
vezunchik
Reply   •   2 楼
vezunchik    5 年前

检查这个片段。您可以将regexp应用于选择器:

>>> from scrapy import Selector
>>> txt = """<img src="//d30v2pzvrfyzpo.cloudfront.net/uk/images/restaurants/65115.gif" itemprop="image" alt="Gourmet Sushi" width="100" height="100" onerror="this.onerror = null;this.src = '//dy3erx8o0a6nh.cloudfront.net/images/serp/serp_default_logo.svg';">"""
>>> sel = Selector(text=txt)
>>> sel.re("src\s?=\s?['\"]([^'\"]+)['\"]")
[u'//d30v2pzvrfyzpo.cloudfront.net/uk/images/restaurants/65115.gif', u'//dy3erx8o0a6nh.cloudfront.net/images/serp/serp_default_logo.svg']

所以,然后你可以 [response.urljoin(url) for url in sel.re("src\s?=\s?['\"]([^'\"]+)['\"]")]