Py学习  »  Python

Python爬取哔哩哔哩实时直播弹幕

Python中文社区 • 6 年前 • 643 次点击  

專 欄


作者:麦艳涛,挖掘机小王子,数据分析爱好者。




用Python爬取哔哩哔哩直播弹幕,关键在于找到哔哩哔哩网站的一个POST网址,和应该POST的数据。代码不长,十分简单。关键在于浏览器开发者工具的使用。希望对于新入门的萌新有一定的借鉴意义。

1、找到POST的网址

先找到一个直播间,点击进去【感觉是废话】。

打开开发者工具【F12】,差不多是这样。

然后刷新【F5】,并点击方法翻到最上面,或者最下面,在这里可能会弹出两三个POST数据【如下图所示】,不要管有几个POST格式的文件,找到下图中标记的哪一个!!


这个文件就包含了我们需要的弹幕。但是,我们需要向服务器提交一下数据,服务器才会返还给我们数据,也就是弹幕。所以在上图的基础上点击右下角的参数。点击后如下图:

在这里会出现三个我们需要提交的数据【注意,我在写这篇文章之前是只需要提交两个数据的】,不过没关系提交三个应该也可以。但是下面的代码里面写的是两个参数,你可以照着我的参数格式直接再加一个就行。最后就是用requests提交参数就行,返回的网页用json方法解析一下就可以很方便的提取了,不用写正则。代码比较少,而且也有注释,所以就不在这里啰嗦了。

2、Python代码


长按扫描关注Python中文社区,

获取更多技术干货!

    

Python 中 文 社 区

Python中文开发者的精神家园

合作、投稿请联系微信:

pythonpost

— 人生苦短,我用Python —
1MEwnaxmMz7BPTYzBdj751DPyHWikNoeFS





今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/t/2b2u2Qg8FS
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/4132
 
643 次点击