社区教程 Wiki

注册登录

创作新主题

社区所有版块导航

Python

python开源 Django Python DjangoApp pycharm

DATA

docker Elasticsearch

分享

问与答闲聊招聘翻译创业分享发现分享创造求职区块链支付之战

aigc

aigc chatgpt

WEB开发

linux MongoDB Redis DATABASE NGINX 其他Web框架 web工具 zookeeper tornado NoSql Bootstrap js peewee Git bottle IE MQ Jquery

机器学习

机器学习算法

Python88.com

反馈公告社区推广

产品

短视频

印度

印度

关注

Py学习 » Python

Python使用socket读取网页源代码实现简单爬虫程序

Python小屋 • 3 年前 • 770 次点击

清华科技大讲堂免费直播课预告：

免费直播课|Python数据可视化与科学计算可视化案例分享，5月28日晚20：00-21：30

============

哔哩哔哩网站免费视频观看地址：

董老师在哔哩哔哩网站免费分享的本学期“Python编程技术”讲课录屏视频，已更新到第11次课共27小时，观看地址：

https://www.bilibili.com/video/BV137411u7tJ/

推荐图书：《Python程序设计基础（第2版）》，ISBN：9787302490562，董付国，清华大学出版社，2020年1月第15次印刷

图书详情：

配套资源：用书教师可以免费获取教学大纲、教案、课件、源码、习题答案、课堂管理与考试系统。

===============

功能描述：

创建套接字，向目标网站HTTP端口80或HTTPS端口443发送请求，获取指定网页的源代码，实现一个简单的网络爬虫程序。

参考代码：

运行结果：

温馨提示

关注本公众号“Python小屋” ，通过菜单“最新资源”==>“历史文章”可以快速查看分专题的1000篇原创技术文章列表（可根据关键字在页面上搜索感兴趣的文章），通过“最新资源”==>“微课专区”可以免费观看500节Python微课，通过“最新资源”==>“培训动态”可以查看近期Python培训安排，通过“最新资源”==>“教学资源”可以查看Python教学资源，海量宝藏等你来挖掘。

---董付国老师Python系列图书---

友情提示：不建议购买太多，最好先通过京东、当当、天猫查阅图书了解目录和侧重点，然后再选择购买适合自己的书。

（1）《Python程序设计（第2版）》（ISBN：978-7-302-43651-5），清华大学出版社，2016年8月出版，2019年度清华大学出版社畅销图书

（2）《Python可以这样学》（ISBN：978-7-302-45646-9），清华大学出版社，2017年2月

（3）《Python程序设计基础（第2版）》（ISBN：978-7-302-49056-2）清华大学出版社，2018年1月出版，2019年度清华大学出版社畅销图书

（4）《中学生可以这样学Python》（ISBN：978-7-302-48039-6）清华大学出版社

（5）《Python程序设计开发宝典》（ISBN：978-7-302-47210-0）清华大学出版社，2018年10月

（6）《玩转Python轻松过二级》（ISBN：978-7-302-49916-9）清华大学出版社，2018年5月

（7）《Python程序设计基础与应用》（ISBN：978-7-111-60617-8），机械工业出版社，2018年9月

（8）《Python程序设计实验指导书》（ISBN：9787302525790），清华大学出版社，2019年4月

（9）《Python编程基础与案例集锦（中学版）》（ISBN：978-7-121-35539-4），电子工业出版社，2019年4月

（10）《大数据的Python基础》（ISBN： 978-7-111-62455-4），机械工业出版社，2019年5月出版

（11）译作《Python程序设计》，机械工业出版社（华章），2018年11月出版

（12）繁体版《Python也可以这样学》，台湾博硕文化股份有限公司，2017年10月出版，本书为《Python可以这样学》在台湾发行的繁体版，两本书内容一样，不建议重复购买。

（13）《Python程序设计实例教程》（ISBN：978-7-111-63198-9），机械工业出版社

（14）《Python数据分析、挖掘与可视化》（ISBN：978-7-115-52361-7），人民邮电出版社，2019年12月

Python相关课程教材选用参考与建议

董付国老师Python在线课程资源使用方法

董付国老师6本Python教材PDF版免费阅读

《Python数据分析、挖掘与可视化》前3章书稿PDF免费阅读

《Python程序设计基础与应用》前3章书稿PDF免费阅读

号外号外--Python小屋刷题神器上线啦

《中学生可以这样学Python》84节微课免费观看地址

相关阅读：

Python使用爬虫技术获取本机所在公网IP地址

Python采集全国高校2020年拟在山东招生普通高校专业（类）选考科目要求

Python自动接收微信群消息并推送相应的公众号文章

Python爬取“Python小屋”公众号所有文章生成独立Word文档

Python借助百度搜索引擎爬取Python小屋密切相关文章

使用Python批量爬取并下载具有防盗链保护的文件

Win10+Python3.6配置Spark创建分布式爬虫

Python使用多进程提高网络爬虫的爬取速度

JavaScript获取本机浏览器UA助力Python爬取糗事百科首页

Python批量爬取名字中带有中文的pdf文件

Python爬取网页中表格数据并导出为Excel文件

Python使用标准库urllib模拟浏览器爬取网页内容

Python爬虫基础：常用HTML标签和Javascript入门

Python+selenium+PhantomJS获取百度搜索结果真实链接地址

Python 3.6模拟输入并爬取百度前10页密切相关链接

手把手教你使用Python+scrapy爬取山东各城市天气预报

Python爬虫系列：使用selenium+Edge查询指定城市天气情况

Python爬虫系列：判断目标网页编码的几种方法

BeautifulSoup解析库select方法实例——获取企业信息

Python批量爬取微信公众号文章中的图片

Python裸奔也疯狂：批量爬取中国工程院院士信息

Python爬虫扩展库scrapy选择器用法入门（一）

Python使用Scrapy爬虫框架爬取天涯社区小说“大宗师”全文

Python不使用scrapy框架而编写的网页爬虫程序

Python爬虫扩展库BeautifulSoup4用法精要

Python社区是高质量的Python/Django开发社区
本文地址：http://www.python88.com/topic/63037

770 次点击

登录后回复

关于移动版 · 三行代码 · 今天看啥 · Code · link之家 · 卧龙搜索 · 藏经阁 · 小百科

Py学习 - 专注于Python技术发展的社区(原Django社区)

沪ICP备11025650号