new scrapy 13 基于bs4库的HTML遍历方法
1. HTML 基本语法结构
2. 查看HTML节点信息
soup = BeautifulSoup(demo, "html.parser")
len(soup.body.contents)
-
contents 类型是列表,可以通过查看列表方式获取其中元素
3. 平行遍历
soup.a.next_sibling
# 对下一个标签平行遍历
soup.a.previous_sibling
# 对上一个标签平行遍历
4.复习
new scrapy 14 基于bs4库的HTML输出
soup.prettify()
# 可以自动换行
bs4 会自动将内容转换成“utf-8编码”。
bs 库总结