社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Python

Python爬虫实战之使用Scrapy爬起点网的完本小说

马哥Linux运维 • 8 年前 • 1176 次点击  

作者:totcw

来源:http://img2.100weidu.com/get?src=http://blog.csdn.net/totcw/article/details/65444660

一.概述


本篇的目的是用scrapy来爬取起点小说网的完本小说,使用的环境ubuntu,至于scrapy的安装就自行百度了。

二.创建项目


scrapy startproject name 通过终端进入到你创建项目的目录下输入上面的命令就可以完成项目的创建.name是项目名字. 

三.item的编写


我这里定义的item中的title用来存书名,desc用来存书的内容.、

四.pipelines的编写


在pipelines可以编写存储数据的形式,我这里就是使用txt形式的文件来存储每一本书

五.Setting的编写


只要将下面代码中的tutorial替换成自己项目的名字就可以

六.spider的编写


七.总结


通过上面的代码虽然可以获取所有书的内容,但是起点是有vip限制的,也就是说必须用起点的vip帐号登录才能查看完本的小说,因此这有点遗憾,我没有起点小说网的会员.


————金三银四课程特惠————

马哥教育精英线下Linux班郑州校区开班倒计时,优惠四重享,赠送高达4000元的学习大礼包:

第一重:4月30日前报名,立减400元,名额有限抢完为止;

第二重:4月30日前报名,赠送马哥教育内部Linux知识精讲教材一本(价值666元);

第三重:4月30日前报名,赠送马哥教育实体服务器使用资格(价值1666元);

第四重:4月30日前报名,赠送马哥教育云学堂学习权限1个(价值1999元);


课程详情,请咨询学习顾问:



马哥教育一号女神,温柔可人,最懂IT男

豌豆

Linux面授班,报名优惠400元,名额有限,抢完为止!



今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/weixin/RgR9wVlqQg
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/1845
 
1176 次点击