Py学习  »  Python

《Python3 网络爬虫开发实战(第二版)》提上日程了!

进击的Coder • 5 年前 • 473 次点击  

做过爬虫的朋友可能听说过我写的一本有关爬虫的书籍《Python3网络爬虫开发实战》,书里面总结了我研究爬虫以来的一些经验。

这本书是在今年的四月份上市的,到现在已经将近半年了,现在书已经重印了七次,累积销售已经两万多册了,可以说是远超我的预期。


在书上市之前,其实我是很煎熬的,由于书比较厚,近 600 页,当时审稿、校验、排版花费了很多时间,差不多有近四个月吧,印刷的时候还因为当时全国各地严查环保问题,印刷厂停了一段时间,当时几乎每天都有好几个朋友问我书什么时候上市,当时问得我都怕了,最后出版时间比原定晚了好久,觉得挺惭愧的。


今年四月书终于上市了,我还清晰地记得我当时去印刷厂第一次拿到自己的书时欣喜的感觉,当时觉得特别开心和有成就感,心想我终于也有了自己的书了,开心得像个孩子,下面是当时拍的皂片。



图看完了接着说。


由于我自己维护了几个 QQ 群,很多微信群,群里主要是交流爬虫相关技术的朋友,书上市之后我的很多朋友都纷纷购买了,有的朋友还非常热情地帮我推广,真的特别谢谢你们的支持。


书刚上市前三个月算是新书,当时这本书也一直处在京东的科技类新书榜的第一位,这也是我没想到的。读者的评价也非常不错,豆瓣也上 9 分了,另外还有不少高校和机构的老师也联系我,并订购了一批作为教材来使用,我感到非常荣幸。


我觉得能够把我的一些知识分享给大家,同时还得到大家的认可,真的是一件非常开心和有成就感的事。


在这里还是要再次感谢一下大家。


感谢我的父母、导师,没有他们创造的环境,我不可能完成此书的写作。

感谢我的女朋友李园,在我写书期间给了我很多的支持和鼓励。同时她还主导设计了本书的封面, 正是她的理解和付出才使本书得以完善。

感谢在我学习过程中与我探讨技术的各位朋友,特别感谢汪海洋先生在我初学爬虫过程中给我提供的指导,特别感谢崔弦毅、苟桃、时猛先生在我写书过程中为我提供的思路和建议。

感谢王军花、陈兴璐编辑,在书稿的审核过程中给我提供了非常多的建议,没有你们的策划和敦促,我也难以顺利完成此书。

感谢为本书撰写推荐语的李舟军老师、宋睿华老师、梁斌老师、施水才老师(排名不分先后), 感谢你们对本书的支持和推荐。

感谢购买和阅读本书的每一位读者,感谢你们的支持和认可,也感谢为本书提供宝贵建议和勘误的每一位朋友。

谢谢。


现在要步入正题了。


大家知道现在技术更新换代是比较快的,尤其是这种偏实战应用的相关技术和框架,可能没几个月,框架就更新了,API 就变了。对于爬虫来说,还面临着网页改版、网站关停、验证码更新、反爬措施更新等各种各样的问题,所以现在书里面的挺多样例其实已经失效了,有的可以更新的项目我还会在 GitHub 上进行更新,保证代码尽量是可用的,可是有些网站直接关停了,就没太有办法了,有一些爬虫经验的朋友如果遇到这些情况倒还好,能知道该怎么解决,但是一些刚接触爬虫的朋友如果碰到这种情况,就会有些不知所措了,这个知识点可能就没法好好地理解了,这样我的书能够给读者提供价值就会打折扣了。另外我当时写书的时候,还有一些知识点由于时间问题或者内容问题就做了删减,所以这本书也不算完完全全就涵盖了爬虫所有的知识点,有一些知识点还是没有覆盖到。


所以就以上问题,我现在就要着手准备开始撰写《Python3网络爬虫开发实战(第二版)》了,相比第一版,第二版主要是做这么几个更新:


  • 把一些过于冗余的部分适当进行删减,比如第一章的环境配置部分可以做适当精简和更新。

  • 把一些过时的案例或者框架使用说明进行更新,比如点触验证码的破解重新更新,PhantomJS 等不再维护的框架做特殊说明。

  • 增加一些新的知识点,如深度学习识别验证码、网页智能解析、Xposed App 爬取、JavaScript 加密分析、Scrapy 深度改造、K8S 管理等等。


上面是第二版的我的一些初步规划,可能还不太完善,后面在撰写的过程中也会不断补充和调整。


时间上的话,我打算尽量能在年前完成这些部分的撰写,然后尽量在明年四五月份出版。当然这只是初步的规划,具体时间还得看到时实际情况,毕竟那时候正式工作了,时间可能也就少了。


其实下面才是正题。


其实这次发文章最主要的目的还是想了解一下大家的看法和建议,想了解一下大家对本书的看法和对新书的期望,比如你对本书有什么改进建议,或者对第二版书籍有什么想了解的知识点,或者还有什么其他的宝贵建议,欢迎大家在评论区留言,我会认真阅读大家的意见和建议,然后尽量整合,并在第二版中的进行更新和修正的。


关于书的内容我已经公开到博客一部分,大家可以点击原文查看详情。


最后是本书的链接,大家可以戳进去了解一下,谢谢支持!

推荐阅读

1

跟繁琐的命令行说拜拜!Gerapy分布式爬虫管理框架来袭!

2

爬虫代理哪家强?十大付费代理详细对比评测出炉!

3

只会用Selenium爬网页?Appium爬App了解一下

4

妈妈再也不用担心爬虫被封号了!手把手教你搭建Cookies池

5

App爬虫神器mitmproxy和mitmdump的使用

崔庆才

静觅博客博主,《Python3网络爬虫开发实战》作者

隐形字

个人公众号:进击的Coder

长按识别二维码关注



今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/t/3q9ePRt3O3
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/24449
 
473 次点击