Py学习  »  Python

Python+django网页设计入门(9):自定义反爬虫功能

Python小屋 • 5 年前 • 393 次点击  

前导课程:

Python+django网页设计入门(8):网站项目文件夹布局

Python+django网页设计入门(7):常用ORM操作

Python+django网页设计入门(6):文件上传与数据导入

Python+django网页设计入门(5):自定义用户注册与登录功

Python+django网页设计入门(4):用户登录与登录验证

Python+django网页设计入门(3):使用SQLite数据库

技术要点:

1)识别请求来自浏览器还是来自爬虫程序,根据不同的访问方式给出不同的响应。

2)获取客户端IP地址并限制其访问时间间隔,如果来自爬虫程序,则多次访问之间的间隔会很短,判断这种情况并给出相应的响应。

3)使用自定义修饰器实现代码复用。

===================

1、修改questions应用的views.py文件,导入time标准库中的time()函数,并定义修饰器函数isCraw()。


2、把定义的修饰器作用到相应的视图函数上,以登录界面为例。


3、执行命令,运行网站,使用浏览器打开登录界面,一切正常。


4、使用Python模块urllib编写简单爬虫程序,尝试读取登录界面信息,失败。


5、修改程序,伪装浏览器访问登录页面,成功。


6、进一步修改爬虫程序,连续多次读取登录页面,第一次成功,后面失败。


温馨提示

进入公众号,通过菜单“最新资源”==>“历史文章”可以快速查看分专题的文章列表,通过“最新资源”==>“微课专区”可以观看Python微课,通过“最新资源”==>“培训动态”可以查看近期Python培训安排,通过“最新资源”==>“教学资源”可以查看Python教学资源。


--------董付国老师Python系列图书--------

1)《Python程序设计(第2版)》清华大学出版社(2018年8月第9次印刷)

2)《Python可以这样学》清华大学出版社(2018年7月第6次印刷)(本书已在台湾发行繁体版)

3)《Python程序设计基础(第2版)》清华大学出版社(2018年9月第6次印刷)

4)《中学生可以这样学Python》清华大学出版社(2018年9月第3次印刷)

5)《Python程序设计开发宝典》清华大学出版社(2018年2月第3次印刷)

6)《玩转Python轻松过二级》清华大学出版社(2018年7月第3次印刷)

7)《Python程序设计基础与应用》机械工业出版社(2018年9月第1次印刷)

8)《Python程序设计实验指导书》清华大学出版社(预计2019年1月出版)

9)《Python编程基础与案例集锦(中学版)》机械工业出版社(预计2019年2月出版)

董老师127课免费视频地址: https://pan.baidu.com/s/1jJeAs8Q 密码: px59



今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/t/4jNMbxtwfb
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/25894
 
393 次点击