社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Python

python 学习 DAY29笔记

Peng_001 • 5 年前 • 519 次点击  

new scrapy 13 基于bs4库的HTML遍历方法

1. HTML 基本语法结构

  • 上行遍历、下行遍历、平行遍历


2. 查看HTML节点信息

  • 检索body节点
soup = BeautifulSoup(demo, "html.parser")
len(soup.body.contents)
  • contents 类型是列表,可以通过查看列表方式获取其中元素

3. 平行遍历

  • 平行遍历必须发生在同一父亲节点下


soup.a.next_sibling
# 对下一个标签平行遍历
soup.a.previous_sibling
# 对上一个标签平行遍历

4.复习

new scrapy 14 基于bs4库的HTML输出

  • 如何让Html 界面更加友好显示?
soup.prettify()
# 可以自动换行

bs4 会自动将内容转换成“utf-8编码”。

bs 库总结

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/56840
 
519 次点击