社区教程 Wiki

注册登录

创作新主题

社区所有版块导航

Python

python开源 Django Python DjangoApp pycharm

DATA

docker Elasticsearch

问与答闲聊招聘翻译创业分享发现分享创造求职区块链支付之战

aigc

aigc chatgpt

WEB开发

linux MongoDB Redis DATABASE NGINX 其他Web框架 web工具 zookeeper tornado NoSql Bootstrap js peewee Git bottle IE MQ Jquery

机器学习

机器学习算法

Python88.com

反馈公告社区推广

产品

短视频

印度

一周十大热门主题

10年顽疾ChatGPT一眼识破！AlphaGo时刻震撼全球医疗界

多邻国联姻瑞幸；if椰子水母企IPO市值冲上100亿；阿里巴巴美国站推B2B先买后付 | TopDi...

时代命题下的民营科技担当：从备份战略看Gitee的国家定位

ChatGPT诞生内幕大曝光！发布前一晚还在纠结

专访上海电气品牌公关总监张笛：从“人带人闯市场”到全球品牌，大国重器的出海进化论 | TopDigi...

Nginx和Apache要成旧爱了？PHP有了新搭档：缝合怪FrankenPHP！

#OpenAI近两年大事回顾##ChatGPT进化史#OpenA-20250703130735

Ilya尘封10年录音曝光！大二入Hinton门下，竟坦言机器学习反直觉

Altman 嘲讽 Meta 挖走的不是顶尖人才，OpenAI 高管首曝内幕：ChatGPT 如何让...

DigiTwin | 上海交大贺兴：基于数字孪生的时空数据分析

关注

Py学习 » Python

python 学习 DAY29笔记

Peng_001 • 5 年前 • 521 次点击

new scrapy 13 基于bs4库的HTML遍历方法

1. HTML 基本语法结构

上行遍历、下行遍历、平行遍历

2. 查看HTML节点信息

检索body节点

soup = BeautifulSoup(demo, "html.parser")
len(soup.body.contents)

contents 类型是列表，可以通过查看列表方式获取其中元素

3. 平行遍历

平行遍历必须发生在同一父亲节点下

soup.a.next_sibling
# 对下一个标签平行遍历
soup.a.previous_sibling
# 对上一个标签平行遍历

4.复习

new scrapy 14 基于bs4库的HTML输出

如何让Html 界面更加友好显示？

soup.prettify()
# 可以自动换行

bs4 会自动将内容转换成“utf-8编码”。

bs 库总结

Python社区是高质量的Python/Django开发社区
本文地址：http://www.python88.com/topic/56840

521 次点击

登录后回复

关于移动版

Py学习 - 专注于Python技术发展的社区(原Django社区)

沪ICP备11025650号