社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

深度学习项目:歌词的自动生成

机器学习AI算法工程 • 4 年前 • 643 次点击  


向AI转型的程序员都关注了这个号👇👇👇

人工智能大数据与深度学习  公众号:datayx



我们实现的是歌词的自动生成。 主要看我在代码中的注释。


数据集获取方式

关注微信公众号 datayx  然后回复 歌词  即可获取。

AI项目体验地址 https://loveai.tech



1:我们加载所需要的模块,这里的模块都是比较常用的模块



2:加载数据集,整理汉字和id之间的映射。从我们的txt文件中读取歌词,每一行是一首歌,因为我们的部分歌中含有应为,我们这里也做一个小小的处理,那就是将英文占比比较大的歌扔掉不用。 见下面代码,并给处理了详细的注释:



输出是: 共36616首歌



3:整理汉字与需要的映射关系,并存到本地,因为我们把模型训练好了,拿到其他地方运行,这个映射是不能少的




5:接下来,我们定义模型,这里我们首先接一个Embedding,就是将输入的向量中每个词转为128维的向量,具体原理,参考下这篇博客:https://blog.csdn.net/jiangpeng59/article/details/77533309



6:我们模型最后输出的是所有词作为下一个词的概率,我们不能单纯的取概率最大,我们这里给一个权重,让其多样性



7: 定义一个回调函数,就是让模型每次训练完一轮后,试着去生成一段序列,看看是什么样子




 8:训练模型并保存



9:模型训练好,我们试着调用一下以训练好的模型,让其生成文本



最后的输出:

 只剩下钢琴被我弹了一曲表演 

失去故事的存在重叠入襟

要不是孩子们流浪

谁能放下好吧气 

不是因为我不怕孤单

不习惯习惯睡发

街景屠水的泛泛

清流旧枝既渺重交可斟学

时光间两千男生好情可以筹码

又不是不知无限 

我感到喧闹太阳下

回来就匆匆忘了

然后觉悟我

至少

我不说说诉

也许我会

甚麽不要分手

爱是寂寞的执着 

用我感情谱生音

轻吻着梦的人生瞬间

天高后回想到最后一切

啊  旁条

逛来驾

静静等个黎明我俩如才能够我的承认

孤星和爱更东西

为何落力不怕你出现

生命已给我

夜雨冰凉,你要离我一直跳,在此刻很轻,温茶又笑清似断肠。

独立平庭一直;。 何以朽,因果师岭名掘互相。。 所有

我知道有人会美丽  

不肯等 喔喔喔喔

令你救我 爱不爱

却在未了只能说

我不会说的

天未要准新心都是接认会得到爆倍 

不介意 脚丫口巧腰都没有

多想关于我们哪个哪有起来的模样

我只好兴奋 我在一起 春天初绽回遨游

过处沙红表远  


原文链接https://blog.csdn.net/shawroad88/article/details/89437839





阅读过本文的人还看了以下:


分享《深度学习入门:基于Python的理论与实现》高清中文版PDF+源代码


《21个项目玩转深度学习:基于TensorFlow的实践详解》完整版PDF+附书代码


《深度学习之pytorch》pdf+附书源码


李沐大神开源《动手学深度学习》,加州伯克利深度学习(2019春)教材


笔记、代码清晰易懂!李航《统计学习方法》最新资源全套!


《神经网络与深度学习》最新2018版中英PDF+源码


将机器学习模型部署为REST API


FashionAI服装属性标签图像识别Top1-5方案分享


重要开源!CNN-RNN-CTC 实现手写汉字识别


yolo3 检测出图像中的不规则汉字


同样是机器学习算法工程师,你的面试为什么过不了?


前海征信大数据算法:风险概率预测


【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类


VGG16迁移学习,实现医学图像识别分类工程项目


特征工程(一)


特征工程(二) :文本数据的展开、过滤和分块


特征工程(三):特征缩放,从词袋到 TF-IDF


特征工程(四): 类别特征


特征工程(五): PCA 降维


特征工程(六): 非线性特征提取和模型堆叠


特征工程(七):图像特征提取和深度学习


如何利用全新的决策树集成级联结构gcForest做特征工程并打分?


Machine Learning Yearning 中文翻译稿


蚂蚁金服2018秋招-算法工程师(共四面)通过


全球AI挑战-场景分类的比赛源码(多模型融合)


斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)


python+flask搭建CNN在线识别手写中文网站


中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程


不断更新资源

深度学习、机器学习、数据分析、python

 搜索公众号添加: datayx  

长按图片,识别二维码,点关注


AI项目体验

https://loveai.tech



Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/34091
 
643 次点击