Py学习  »  Python

神级程序员用Python对上万首唐诗进行数据分析!此乃神级程序员也

Python学习交流 • 5 年前 • 787 次点击  

中国是一个历史悠久的强国!他的文化自然也是悠远流长!唐诗我想大家都学过,没人是没有学过的,这些东西小编不希望大家随着科技的更新而被遗忘,希望大家都能谨记!

一个人自学很有可能因为动力不足而中途放弃,可以尝试加入一个或几个适合自己的网络群体(QQ、 微信、 社区等),寻找志同道合的学习伙伴,相互交流、相互促进.如果大家想要学习交流欢迎给我私信,私信关键词: 01.02.03.04 都会得到不一样的资料!系统坚持到关键词会自动发送。分开发送!01或者02


2.2 万紫千红一片绿——《全唐诗》中的色彩

笔者在这里找了51个古语中常用的颜色的单字(注意是古汉语语境中的颜色称谓),其中以红色系(红、丹、朱、赤、绛等)、黑色系(暗、玄、乌、冥、墨等)、绿色系(绿、碧、翠、苍等)及白色系(白、素、皎、皓等)为主,这些颜色及其对应的字频如下表所示:

以下是TOP200的共现双字词:



下面,笔者选取一些单字进行字向量关联分析,展示如下:

注意,在这里得到的情绪相关字,笔者将收集整理它们,制成情绪词典,用于后面的诗词情绪分类。

为了取得更好的效果,笔者采用最新的NestedLSTM+Conv1D的深度学习模型来做情绪判断,它能较好的提炼文本里的特征和语序信息,记住更长的语义依赖关系,做出较为精确的情绪判断。其网络结构如下所示:

接着,来试试实际的效果:

以“春雨”打头,生成500字的诗词,结果如下:


再看看笔者较为欣赏的2句名句,机器很好的捕捉到了它们之间的相似语义关系,即使词汇不尽相同,但仍能从语义上检索相似诗句。


预处理后是这样的形式:

用Semiotic Squares进行分析的结果如下图所示(点击即可放大显示):

作者:苏格兰折耳喵

侵权请联系小编删除哦!

希望大家都能不忘初心!谢谢阅读!



今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/t/7EiTkTMyPC
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/11085
 
787 次点击