社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

【剑桥大学博士论文】《用于英语口语自动评估和反馈的深度学习》282页

专知人工智能 • 3 年前 • 184 次点击  
全球对学习第二语言(L2),特别是英语的需求不断增长,导致人们对自动口语评估产生了浓厚的兴趣,无论是用于计算机辅助语言学习(CALL)工具,还是用于对正式资格认证的候选人进行评分。本论文介绍了对非母语英语自发语音的自动评估的研究,以期能够向学习者提供有意义的反馈。自动口语评估的挑战之一是,除了通常提供的整体分数外,还要对考生的口语能力的特定方面或观点给予反馈。另一个挑战是在单词或语篇层面上检测发音和其他类型的错误,并将它们以有用的方式反馈给学习者。
通常很难获得准确的训练数据,因为不同的观点有不同的分数,而且,由于考官通常被训练为给出整体的分数,单一观点的分数可能存在一致性问题。相反,整体分数可用于各种标准评估任务,如Linguaskill。因此,我们进行了一项调查,研究是否可以从只使用整体分数训练的系统中获得与说话人能力的特定观点相关的评估分数。
端到端的神经系统被设计成具有调整到单一观点的结构和输入形式,特别是发音、节奏、语调和文字的每一个观点。通过在大量的候选数据上训练每个系统,个人观点的信息应该可以被提取。对每个系统的预测之间的关系进行评估,以检查它们是否实际上提取了关于说话人的不同信息。研究了三种结合系统来预测整体分数的方法,即对它们的预测进行平均化,对它们的中间表征进行串联和处理。结合起来的评分器相互之间以及与基线方法进行了比较。
当所涉及的语音是自发的,特别是考虑到人类对发音错误的注释不一致所带来的挑战,错误检测和错误倾向诊断的任务变得特别具有挑战性。我们提出了一种解决这些问题的方法,即区分词汇错误和口音错误,前者是指说话者不知道某个特定单词是如何发音的,后者是指候选人的讲话表现出一致的电话替换、删除和插入的模式。我们分析了三个由多个母语国家的人发表的非母语英语语音的注释语料,调查了人类注释的一致性,并提出了一种检测个别口音和词汇错误以及在说话人层面诊断口音错误倾向的方法。

便捷下载,请关注专知人工智能公众号(点击上方蓝色专知关注)

  • 后台回复“ES282” 就可以获取【剑桥大学博士论文】《用于英语口语自动评估和反馈的深度学习》282页》专知下载链接


  • 欢迎微信扫一扫加专知助手,咨询使用专知,获取最新AI专业干货知识教程资料!


专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取70000+AI(AI与军事、医药、公安等)主题干货知识资料!

点击“阅读原文”,了解使用专知,查看获取70000+AI主题知识资料
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/143012