社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Python

贾玲成全球票房最高女导演!用Python分析《你好,李焕英》到底厉害在哪

网易云课堂 • 4 年前 • 425 次点击  

要说今年最出圈的词汇,《你好,李焕英》绝对算是最热的黑马之一。不鸣则已,一鸣惊人,这部优秀的作品更是让贾玲荣获“全球票房最高女导演”的称号。


(图片来自于“猫眼”程序)


要从感情上分析这部电影为什么能取得如此成功,想必大家已经看得很多,今天我们从数据分角度出发,Python分析一下这位春节档的最大赢家——《你好,李焕英》!



首先,我们要简单使用Python爬取豆瓣的短评数据。目前这部剧豆瓣上共有612433人进行评分,分数为8.1分,这种评分在国产剧中是很优秀的成绩了。


这里我们使用requests并搭配xpath来爬取豆瓣评价以及评论者的个人信息。


from lxml import etree
import requests


静待十几秒,就成功获取了500条豆瓣评论数据👇



简单筛选,我们就可以从500条数据统计出主演提及次数,并利用pyecharts制作条形图。


bar = (Bar()
      .add_xaxis(x_df)
      .add_yaxis('提及次数', y_df)
      .set_global_opts(title_opts=opts.TitleOpts(title='《你好,李焕英》豆瓣评论中的主演提及次数')
                      ,visualmap_opts=opts.VisualMapOpts())
    )

bar.render_notebook()



我们通过排序可以发现,贾玲饰演的自己,张小斐饰演的李焕英是观众评论提及最多的角色。


我们还可以用pyecharts来制作map地图,来展示评论者的地域分布:



可以看到,豆瓣上给《你好,李焕英》评分的观众中,来自北京市的最多!


最后我们再利用stylecloud制作一个词云图,看看大家主要都在评论些什么?


stylecloud.gen_stylecloud(text=' '.join(text),
                         collocations=False,
                         icon_name='fas fa-chart-pie',
                         size=600,
                         output_name='./评论词云图.png')
Image(filename='./评论词云图.png')

结果如下:



豆瓣评论中主要围绕的关键词有"母亲"和"女儿",以及对应的角色"贾玲"和"李焕英"。除此以外,"沈腾"、"穿越"、"反转"、"结尾"、"小品"等关键词也被多次提到。


上文就是我们用Python分析一下《你好,李焕英》这部叫好又叫座的电影了。


不过只是使用 Python 简单给你演示一下数据分析的魅力,后续我们其实还能做深入的数据挖掘。而且,实际上数据分析除了获取数据,存储数据,还需要会对数据进行预处理,提取,然后分析,统计,报告等操作。


如果你对使用 Python 数据分析感兴趣,想要拿到一份薪资不错的工作,但是目前还有些许茫然,有很多不清楚的地方,比如数据分析的学习路径是怎么样的?如何制作精美的可视化视图?如何进行股票量化等等?


我这次特地总结了一张思维导图给大家,点击放大看更清楚哦。

(点击查看高清大图)

基于此,我这里将我以前学习过程中用过的电子书(技能类、统计类、业务类),还有相关视频免费分享给大家,省去了你们挑选视频的时间,也希望能够对你们的学习有所帮助。

PS:我总结的资料有点多哦,差不多有4G,大家一定要给你的百度云盘空出位置来哦!

(资料仅展示部分)

 

免费领取资料和大厂直播课


大家按照以下步骤,获取我特意挑选出来的书籍、视频。


1、扫二维码免费报名课程(限时300个名额)

2、报名成功后添加小助手即可免费领取资料


(扫码了解课程详情)

如果遇到一些环境配置,还有一些错误异常等bug,资料就显得不太够用,这时就需要找到老师,给我们特别讲解。

或者是想快速学习数据分析领域知识,不妨先找一找直播课看看,了解当下最贴合实际的学习思路,确定自己的方向。

 

网易直播课内容详情


我特别推荐网易云课堂的《3天数据分析实战集训营》,定期更新干货知识。

还有网易特邀数据架构讲师——“证书狂魔”Mars老师,通过直播现场教学和实战的同时,开放互动参 与学习,让你的数据分析之旅快人一步!

4月13日  20:00&数据可视化入门:
60分钟,用Tableau快速实现酷炫可视化效果
流程解析:5个关键步骤,掌握核心方法
过程处理:2个关键工具,提升工作效率
实战项目:二手车网站数据爬取+可视化

4月14日 20:00&数据可视化进阶

4个案例,用Python实现【交互式可视化报表】

入门级图表:用Python快速实现

进阶交互图:股票价格走势

动态趋势图:电商直播分析

地图效果图:销售数据汇总


4月15日 20:00&量化交易入门和进阶:
利用Python,快速选择优质股票

场景工具:利用pandas工具分解KDJ指标构成

流程处理: 交易数据爬取,业务场景分析建模和可视化

分析结果:用KDJ指标模型对比特币行情买卖点搜索&交易回溯

实战项目:掌握根据数据指数和分析工具寻找虚拟货币买卖原理


他们每周都会定期分享一些干货供大家学习参考,对学习很有帮助。

(深度学习DeepLearning.ai实验室认证)

(微软/甲骨文/Cloudera等公司颁发的数据分析证书)

4步学会数据可视化,办公效率提高三倍

(更多精彩内容 等你解锁)

 

免费领取资料和大厂直播课

大家按照以下步骤,获取我特意挑选出来的书籍、视频。

1、扫二维码免费报名课程(限时300个名额)

2、报名成功后添加小助手即可免费领取资料

(扫码了解课程详情)

(记得添加小助手领资料喔,说不定你哪天就用上了)
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/111188
 
425 次点击