社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Python

Python爬取哔哩哔哩实时直播弹幕

Python中文社区 • 7 年前 • 1042 次点击  

專 欄


作者:麦艳涛,挖掘机小王子,数据分析爱好者。




用Python爬取哔哩哔哩直播弹幕,关键在于找到哔哩哔哩网站的一个POST网址,和应该POST的数据。代码不长,十分简单。关键在于浏览器开发者工具的使用。希望对于新入门的萌新有一定的借鉴意义。

1、找到POST的网址

先找到一个直播间,点击进去【感觉是废话】。

打开开发者工具【F12】,差不多是这样。

然后刷新【F5】,并点击方法翻到最上面,或者最下面,在这里可能会弹出两三个POST数据【如下图所示】,不要管有几个POST格式的文件,找到下图中标记的哪一个!!


这个文件就包含了我们需要的弹幕。但是,我们需要向服务器提交一下数据,服务器才会返还给我们数据,也就是弹幕。所以在上图的基础上点击右下角的参数。点击后如下图:

在这里会出现三个我们需要提交的数据【注意,我在写这篇文章之前是只需要提交两个数据的】,不过没关系提交三个应该也可以。但是下面的代码里面写的是两个参数,你可以照着我的参数格式直接再加一个就行。最后就是用requests提交参数就行,返回的网页用json方法解析一下就可以很方便的提取了,不用写正则。代码比较少,而且也有注释,所以就不在这里啰嗦了。

2、Python代码


长按扫描关注Python中文社区,

获取更多技术干货!

    

Python 中 文 社 区

Python中文开发者的精神家园

合作、投稿请联系微信:

pythonpost

— 人生苦短,我用Python —
1MEwnaxmMz7BPTYzBdj751DPyHWikNoeFS





今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/t/2b2u2Qg8FS
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/4132
 
1042 次点击