简介 口语语言理解(Spoken Language Understanding,SLU)作为任务型对话系统的核心组件,目的是为了获取用户询问语句的框架语义表示(semantics frame)信息,进而将这些信息为对话状态追踪模块(DST)以及自然语言生成模块(NLG)所使用。
SLU任务通常包含以下两个任务:意图识别任务(intent detection)和槽位填充任务(slot filling),以下图的句子“I like to watch action movie”为例,这两个任务的输出对应分别为WatchMovie和O、O、O、B-movie-type、I-movie-type、I-movie-type。
图1 SLU任务举例 近年来,SLU领域获得了巨大的突破,在经典数据集ATIS和SNIPS上的指标也做到了97%、99%以上。那么该方向的未来如何,目前进展又是如何呢?
我们最近整理了一个仓库,包含了SLU领域最新工作的总结,还涵盖了一些前沿方向的讨论,并且也包括了一些开源资源总结,希望能对这个领域的发展有一点帮助,值得对SLU感兴趣的同学了解、关注。
资源地址: https://github.com/yizhen20133868/Awesome-SLU-Survey
下面简单介绍一下这个仓库,总体目录如下。
图2 仓库的总体目录 一、新分类,全总结 作者将目前的这个SLU仓库的资源按照single models、joint models、pre-trained models、frontiers for SLU来进行归纳整理。
图3 对SLU仓库资源进行归纳整理 其中对于联合模型作者还分为了隐式和显式建模,显式建模还包括单向建模和双向建模两种方式,值得了解。
图4 联合模型示意图 二、目前SLU的相关资源 包括一些survey paper,来帮助大家快速了解这个领域。
图5 survey paper links 三、开源的SLU论文仓库整理 然后还介绍了目前已经开源的SLU论文仓库,可以帮助大家利用代码进行学习。
图6 已开源的SLU论文仓库 四、数据集整理及下载地址 对于SLU用到的经典数据集,我们不仅提供了数据集的描述、简介,还有对应的下载地址,极大的方便大家找到相关的数据集。
图7 SLU用到的相关数据集 五、Leaderboard整理 对于主流数据集,我们还提供了leaderboard,方便大家跟踪进展。
图8 Leaderboard整理 六、未来挑战方向及相关工作整理 而且对于提到的几个未来方向,整理了目前为止的发表的顶会工作,如跨语言SLU。
图9 目前已发表的相关顶会工作 希望这个仓库能帮助大家快速了解SLU领域,并进行一些自己的探索,欢迎大家PR以及Star!点击“阅读原文 ”直达仓库地址。
点击下方卡片,关注公众号“机器学习算法与自然语言处理”,获取更多信息:
下载1:四件套
在机器学习算法与自然语言处理公众号后台回复 “四件套” ,
即可获取学习TensorFlow,Pytorch,机器学习,深度学习四件套!
下载2:仓库地址共享
在机器学习算法与自然语言处理公众号后台回复 “代码” ,
即可获取195篇NAACL+295篇ACL2019有代码开源的论文。开源地址如下: https://github.com/yizhen20133868/NLP-Conferences-Code
重磅! 机器学习算法与自然语言处理 交流群 已正式成立 !
群内有大量资源,欢迎大家进群学习!
额外赠送福利资源!深度学习与神经网络,pytorch官方中文教程,利用Python进行数据分析,机器学习学习笔记,pandas官方文档中文版,effective java(中文版)等20项福利资源
获取方式:进入群后 点开群公告即可领取下载链接
注意: 请大家添加时修改备注为 [学校/公司 + 姓名 + 方向]
例如 —— 哈工大+张三+对话系统。
号主,微商请自觉绕道。谢谢!
推荐阅读:
Tensorflow 的 NCE-Loss 的实现和 word2vec
多模态深度学习综述:网络结构设计和模态融合方法汇总
awesome-adversarial-machine-learning资源列表
点击下方卡片,关注公众号“机器学习算法与自然语言处理”,获取更多信息: