社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Python

Python数据分析之基情的择天记

Python中文社区 • 7 年前 • 934 次点击  

專 欄


罗罗攀,Python中文社区专栏作者

专栏地址:

http://www.jianshu.com/u/9104ebf5e177




人一生都可能无法逆天改命,但你却是要去奋斗一把。本文章主要通过最简单的共线性关系,利用gephi工具绘制择天记的人物关系图。 
准备工作

在网上下载《择天记》小说以及创建小说人物的txt。

jieba库 
需要下载gephi软件 
注意:安装路径不能有中文字;需要安装java环境,不然无法使用gephi。

定义数据结构

names用于存入小说人物和出场次数;relationships保存人物关系的有向边,该字典的键为有向边的起点,值为一个字典edge,edge的键是有向边的终点,值是有向边的权值,代表两个人物之间联系的紧密程度;linenames存入每行小说出现的人物;all_names是小说所有人物。 
添加人名到jieba词库中

jieba库分词可能并不能把小说的人物都切开,我们需要把这些人名添加到词库中,以便成功分词。

统计出场人数

通过图可以看出,陈长生作为主角,出场最多,而他的好基友是排第二的,而他的女票徐有容却是排到第五,这与一些玄幻小说不一样,注定了这是一部基情的小说。

人物关系及写入文件

绘制人物关系图

最后利用gephi绘制人物关系图。


长按扫描关注Python中文社区,

获取更多技术干货!

    

Python 中 文 社 区

Python中文开发者的精神家园

合作、投稿请联系微信:

pythonpost

— 人生苦短,我用Python —
1MEwnaxmMz7BPTYzBdj751DPyHWikNoeFS




本文为作者原创作品,未经作者授权同意禁止转载


点击阅读原文加入全国金融行业Python开发者联盟

在公众号底部回复XFJR加入Python消费金融联盟

在公众号底部回复LHJY加入Python量化交易联盟


今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/t/mmUQCS64Nt
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/2839
 
934 次点击