Py学习  »  Python

python 学习 DAY29笔记

Peng_001 • 4 年前 • 436 次点击  

new scrapy 13 基于bs4库的HTML遍历方法

1. HTML 基本语法结构

  • 上行遍历、下行遍历、平行遍历


2. 查看HTML节点信息

  • 检索body节点
soup = BeautifulSoup(demo, "html.parser")
len(soup.body.contents)
  • contents 类型是列表,可以通过查看列表方式获取其中元素

3. 平行遍历

  • 平行遍历必须发生在同一父亲节点下


soup.a.next_sibling
# 对下一个标签平行遍历
soup.a.previous_sibling
# 对上一个标签平行遍历

4.复习

new scrapy 14 基于bs4库的HTML输出

  • 如何让Html 界面更加友好显示?
soup.prettify()
# 可以自动换行

bs4 会自动将内容转换成“utf-8编码”。

bs 库总结

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/56840
 
436 次点击