python爬取QQ说说并生成词云图，回忆满满

当年的我还是那么风华正茂、幽默风趣...

言归正传，本次使用的是

selenium模拟登录+BeautifulSoup4爬取数据+wordcloud生成词云图

pip install beautifulsoup4

下表列出了主要的解析器,以及它们的优缺点:

使用selenium模拟登录QQ空间，安装pip install selenium

我用的是chrom浏览器，webdriver.Chrome()，获取Chrome浏览器的驱动。

这里还需要下载安装对应浏览器的驱动，否则在运行脚本时，会提示

chromedriver executable needs to be in PATH错误，用的是mac，网上找的一篇下载驱动的文章，https://blog.csdn.net/zxy987872674/article/details/53082896

同理window的也一样，下载对应的驱动，解压后，将下载的**.exe 放到Python的安装目录，例如 D:\python 。同时需要将Python的安装目录添加到系统环境变量里。

qq登录页http://i.qq.com，利用webdriver打开qq空间的登录页面

driver = webdriver.Chrome()

driver.get("http://i.qq.com")

打开之后右击检查查看页面元素，发现帐号密码登录在login_frame里，先定位到所在的frame，driver.switch_to.frame("login_frame") ，再自动点击帐号密码登录按钮，自动输入帐号密码登录，并且打开说说页面，详细代码如下

这个时候可以看到已经打开了qq说说的页面了，注意部分空间打开之后会出现一个提示框，需要先模拟点击事件关闭这个提示框

同时因为说说内容是动态加载的，需要自动下拉滚动条，加载出全部的内容，再模拟点击下一页加载内容。

F12查看内容，可以找到说说在feed_wrap这个

，

今天看啥 - 高品质阅读平台
本文地址：http://www.jintiankansha.me/t/Zit96rLNov