社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Python

用Python分析《权力的游戏》

Python中文社区 • 7 年前 • 988 次点击  

專 欄

作者:麦艳涛,挖掘机小王子,数据分析爱好者。

原文链接:https://zhuanlan.zhihu.com/p/28475619




一:简介

《权力的游戏》(Game of Thrones),是美国HBO电视网制作推出的一部中世纪史诗奇幻题材的电视剧。该剧改编自美国作家乔治·R·R·马丁的奇幻小说《冰与火之歌》系列。该剧成功塑造成千上万形象饱满的人物角色、怪诞独特充满想象的风土人情,其空间之完整、细节之丰富、叙事之恣意让人感叹!现在让我们用数据分析的方式看一看这个残酷的世界!!(本文所使用的数据集来自Kaggle网站)

二:数据集介绍

该数据集包含了三个CSV文件,分别是:battles.csv,character-deaths.csv和character-predictions.csv。现分别介绍如下:

battles.csv:《权利的游戏》中所有的战争。 
character-deaths.csv:人物死亡数据集。 
character-predictions.csv:人物命运预测数据集。

在每一个CSV数据里面都包含了大量的变量,读懂这些变量名所代表的含义非常有必要。例如:battles.csv中的year变量代表战争发生的时间,battle_type代表战役类型,有伏击战,围攻战,突袭战等。

三:导入所需模块并加载数据集

设置绘图风格(本人电脑不能在图中添加中文字符):

导入数据集:

四:数据探索性分析

哪个区域拥有最多的战争

战争类型的比较

可以看出对阵战最多,攻城战次之

哪位国王好战呢?!!

哪位国王被攻击最多呢?!

主要人物的死亡与被俘事件/根据年分组

军队实力对于战争结果的影响

蓝色代表进攻方失败,图中右下角以少胜多,不知道这场战役是怎么打的??

不同国王的军队里面有多少指挥官,红色线代表均值,五角星代表异常值

相关性可视化

主要可视化的是character-deaths.csv数据集和character-predictions.csv数据集。

去除非数值的行:

可视化:

从相关性图中可以看到一些符合“感觉”的关系,比如《权利的游戏》与《冰与火之歌》第一册的相关系数达0.86。

五:结尾

本文旨在抛砖引玉!因为我从未看过《权力的游戏》!(严格来说看过开头大概20分钟吧!)。在分析的时候“深感无力”,因为数据分析本来就是建立在对业务或者项目熟悉的基础上!所以本文的分析严重欠缺美剧知识!分析不足之处还请见谅!!!


长按扫描关注Python中文社区,

获取更多技术干货!

    

Python 中 文 社 区

Python中文开发者的精神家园

合作、投稿请联系微信:

pythonpost

— 人生苦短,我用Python —
1MEwnaxmMz7BPTYzBdj751DPyHWikNoeFS




本文为作者原创作品,未经作者授权同意禁止转载


今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/t/AkE21qtQKS
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/3271
 
988 次点击