Py学习  »  Python

用Python分析李小璐微博

小蚊子数据分析 • 6 年前 • 695 次点击  

作者:微博@大数据分析实战


        近年来,随着我国人民生活水平不断提高,明星们的生活也不是那么高不可攀。因此,粉丝们对于明星们结婚的消息,越来越接受,胡歌的粉丝们,还整天担心胡歌找不到对象,每到情人节,一想到他孤单一人,倍觉难受。


        正所谓有结婚,就必然有离婚和出轨,例如薛之谦、刘恺威、林丹,都是典型案例。这不,近期没有啥好作品,还说自己演技比群众高一个珠峰,还上了吐槽大会的李小璐,不甘寂寞也和PGONE整了一出夜宿门。


        下面,我就使用Python,来看看各大媒体,是怎么评论这个事情的,使用Python抓取新浪微博,根据关键字“李小璐PGONE”,可以搜索到669条热门微博(这个并非所有的,而是当前新浪微博可查询的)。


图1、新浪微博媒体发布数据截图


        接着,我们来统计媒体发布内容的词频,然后使用词云图,来展现词频。


图2、热门微博生成的词云


        从词云中,我们可以看出,这个事件中,涉及到的人物有李小璐、PGONE、贾乃亮、王思聪、卓伟、马苏,其中,最无辜的是李小冉同学,因为名字类似,也被网友火热光临了一把。


图3、涉及的人物词频


        接着,我们来看看网友们对该事件的评论如何,在李小璐的微博中,找到该微博:


图4、李小璐回复该事件的微博


        直接抓取转发的4.5万用户评论,然后统计词频绘制词云,如下图所示:


图5、网友评论词云


        可以看到,网友们的态度主要是集中在恶心、出轨以及相信、喜欢这两种态度上,但是呢,在网友的词频里面,竟然很少提及到PGONE,也就是说,在李小璐的微博下面,大家都是在讨论李小璐和贾乃亮的爱情啊。


有的朋友可能要问了,要学什么课程也能做出以上分析呢?答案就是学习《数据分析进阶(Python分析与挖掘)》系列视频课程

包含课程:

Python数据分析实战

数据挖掘理论入门

Python数据挖掘实战

Python爬虫数据抓取实战

PS:这是进入大数据分析必备的系列课程,想玩转大数据分析的朋友一定要学的,特别是准备进入或已经进入互联网行业的朋友。


现已有1000+学员加入学习数据分析进阶(Python分析与挖掘》,前2000名可享6折319元原价526元)优惠。


点“阅读原文”进入课程页面学习。


今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/t/LOCT8v4Vqk
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/5110
 
695 次点击