Python中国社区  »  Python

用Python分析李小璐微博

小蚊子数据分析 • 1 周前 • 62 次点击  

作者:微博@大数据分析实战


        近年来,随着我国人民生活水平不断提高,明星们的生活也不是那么高不可攀。因此,粉丝们对于明星们结婚的消息,越来越接受,胡歌的粉丝们,还整天担心胡歌找不到对象,每到情人节,一想到他孤单一人,倍觉难受。


        正所谓有结婚,就必然有离婚和出轨,例如薛之谦、刘恺威、林丹,都是典型案例。这不,近期没有啥好作品,还说自己演技比群众高一个珠峰,还上了吐槽大会的李小璐,不甘寂寞也和PGONE整了一出夜宿门。


        下面,我就使用Python,来看看各大媒体,是怎么评论这个事情的,使用Python抓取新浪微博,根据关键字“李小璐PGONE”,可以搜索到669条热门微博(这个并非所有的,而是当前新浪微博可查询的)。


图1、新浪微博媒体发布数据截图


        接着,我们来统计媒体发布内容的词频,然后使用词云图,来展现词频。


图2、热门微博生成的词云


        从词云中,我们可以看出,这个事件中,涉及到的人物有李小璐、PGONE、贾乃亮、王思聪、卓伟、马苏,其中,最无辜的是李小冉同学,因为名字类似,也被网友火热光临了一把。


图3、涉及的人物词频


        接着,我们来看看网友们对该事件的评论如何,在李小璐的微博中,找到该微博:


图4、李小璐回复该事件的微博


        直接抓取转发的4.5万用户评论,然后统计词频绘制词云,如下图所示:


图5、网友评论词云


        可以看到,网友们的态度主要是集中在恶心、出轨以及相信、喜欢这两种态度上,但是呢,在网友的词频里面,竟然很少提及到PGONE,也就是说,在李小璐的微博下面,大家都是在讨论李小璐和贾乃亮的爱情啊。


有的朋友可能要问了,要学什么课程也能做出以上分析呢?答案就是学习《数据分析进阶(Python分析与挖掘)》系列视频课程

包含课程:

Python数据分析实战

数据挖掘理论入门

Python数据挖掘实战

Python爬虫数据抓取实战

PS:这是进入大数据分析必备的系列课程,想玩转大数据分析的朋友一定要学的,特别是准备进入或已经进入互联网行业的朋友。


现已有1000+学员加入学习数据分析进阶(Python分析与挖掘》,前2000名可享6折319元原价526元)优惠。


点“阅读原文”进入课程页面学习。


今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/t/LOCT8v4Vqk
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/5110
 
62 次点击  
分享到微博
分享
社区所有版块导航
Python
python开源   pycharm   Django   Python   DjangoApp  
DATA
Elasticsearch   docker  
WEB开发
linux   MongoDB   bottle   tornado   Redis   IE   NoSql   DATABASE   MQ   Bootstrap   NGINX   js   其他Web框架   peewee   Jquery   web工具   Git   zookeeper  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广