Py学习  »  Python

大家好,我给大家介绍下,这是用Python分析薛之谦微博互撕的实战

马哥Linux运维 • 6 年前 • 518 次点击  

9月21日上午10:04,薛之谦终于在微博晒出了劲爆证据,回应了前几天李雨桐发布的微博《我和薛之谦的事绝非“爱情”这个范围里能够释怀和解释的》,回复如下:

图1、薛之谦的回复微博

原文比较长,有兴趣自行上薛之谦微博查看原文,不过薛之谦的回应思路很清晰,可以总结如下:

1、拿了李的100万给小高的事纯属捏造


2、当时跟李在一起的时候,就跟小高协议分手了


3、晒出李雨桐写的信,他们之间是李雨桐先爱上薛之谦的


4、晒出微信记录,李雨桐曾经出轨过,请求薛之谦的原谅


5、和小高协议离婚,卖掉房子给的高的钱,并不是李雨桐给的,如果是拿了李雨桐的1000万,愿意入狱


6、给李公司分红1079万,个人转账给李218万,给李买房买车花了200多万


7、2015年夏天分手,李雨桐此时怀孕,两人商量决定放弃孩子,李雨桐妈妈要100万损失费,薛之谦同意。9月李有了韩国新男友,10月李家人称手术大出血向薛之谦索要5000万,但薛之谦称李雨桐微博显示李雨桐在韩国玩


8、11月8日,薛之谦被要求和李单独谈,李未出现,李母带着一个男人对薛实施暴力,并将录像发到网上


9、2016年1月26日与李雨桐父亲签署协议,支付了140万,感情划上句号。


10、3月28日李重新加薛的微信,提出重新合作做服装,并提出要借500万资金,薛将UUJULY无偿送给李,并愿意送其50万启动资金,后店铺闲置;


11、9月15日李雨桐家人联系薛之谦要100万,薛之谦回复没那么傻,一边微博骂他,一边要钱,薛之谦拒绝。


12、2017年9月8日,李给薛发短信,称给一天时间考虑,不然要将一切交给媒体。


薛之谦做出回应之后,整个事态有了什么样的变化呢?这里我们使用Python,来对薛之谦这条微博产生的评论数据进行抓取与数据分析。


图2、导入数据

导入数据后,可以看到,在短短不到一个小时内,就累计了16996条评论数据,我们就使用这份数据,看看网友们的态度是怎样的。


图3、回复内容数据


绘制词云图,首先需要进行分词,使用以下代码,即可把网友们的回复,进行分词,然后得到最后的分词数据框。

图4、分词代码示例

执行代码,可以看到,第一列是回复的ID,第二列是分词后的词组。


图5、分词结果


接着,使用这份数据,来进行词云图的绘制,绘制之前,当然要把停用词(的、吧、这等词)去掉。

图6、移除停用词代码


图7、绘制词云图

执行代码,即可得到词云图如下所示:


图8、网友评论词云图

从词云图可以看出,网友们对于薛之谦的回应,基本保持相信的态度,表示一如既往地支持他。


这个结果也是小编的意料之中,咱们再回过头,去看看李雨桐发布的微博,看看网友在薛之谦回应之前和回应之后,网友们对她的回复会不会有什么变化。


图9、李雨桐发布的微博


我们把这条微博今天之前的评论,也就是薛之谦回应之前的评论,进行词云图的绘制,可以看到,如下所示:


图10、薛之谦回应之前网友的态度

我们把这条微博今天的评论,也就是薛之谦回应之后的评论,进行词云图的绘制,可以看到,如下所示:


图11、薛之谦回应之后网友的态度

可以看到,薛之谦回应之后,李雨桐发布的微博下面,逐渐开始出现支持薛之谦的声音,例如证据、出来、相信、打脸、出轨蹭热度等词语。


来自:小蚊子数据分析(微信号:wzdata)

作者:ken


————广告时间————

马哥教育2017年Python自动化运维开发实战班,马哥联合BAT、豆瓣等一线互联网Python开发达人,根据目前企业需求的Python开发人才进行了深度定制,加入了大量一线互联网公司:大众点评、饿了么、腾讯等生产环境真是项目,课程由浅入深,从Python基础到Python高级,让你融汇贯通Python基础理论,手把手教学让你具备Python自动化开发需要的前端界面开发、Web框架、大监控系统、CMDB系统、认证堡垒机、自动化流程平台六大实战能力,让你从0开始蜕变成Hold住年薪20万的Python自动化开发人才

扫描二维码领取学习资料

感谢您抽出  ·  来阅读此文

更多Python好文请点击【阅读原文】哦

↓↓↓


今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/t/JpRbboP9bB
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/3700
 
518 次点击