Py学习  »  Python

掌握Python和英伟达这个工具,你也能做出自己的对话机器人

机器之心 • 2 年前 • 332 次点击  


让计算机能听、能看、能说、能感觉,是未来人机交互的发展方向,其中语音已成为未来最被看好的人机交互方式,语音比其他的交互方式有更多的优势。

目前,语音服务存在于各种场景中,包括实时会议记录、视频实时直播字幕、呼叫中心语音质检、实时会议记录等。想要实现不同的语音服务,这涉及到方方面面的技术,例如,在进行实时会议记录任务时,需要将会议中的音频实时转写为文字辅助会议记录工作,同时适用于电视会议等远距离场景,这涉及到自动语音识别(ASR)技术。

除此以外,我们在日常生活中,也经常遇到需要将文本转化成语音的技术(TTS) ,该技术可以通过自然逼真的智能语音,让机器拥有「说话」的能力;而我们日常观看的新闻和视频APP中总是向我们推荐感兴趣的内容,这又涉及到义理技术。

那么,有没有一种技术,可以同时完成自动语音识别、语音合成、语义理解的技术任务?

今年,英伟达发布了 NVIDIA Riva,这是一种现成的语音服务,可以轻松部署在任何云或数据中心。NVIDIA Riva的设计旨在帮助用户轻松、快速地访问会话 AI 功能,实现开箱即用,通过一些简单的命令和 API 操作就可以快速构建高级别的语音识别服务。该服务可以处理数百至数千音频流作为输入,并以最小延迟返回文本;还能快速构建高级别的对话式 AI 服务。 

NVIDIA Riva是一个使用了 GPU 加速,快速部署高性能会话式 AI 服务的 SDK,可用于快速开发语音 AI 的应用程序。Riva SDK 在 NVIDIA GPU 上运行,在高吞吐量水平下提供最快的推断响应。

目前,NVIDIA Riva整合了ASR、TTS和语义理解等智能算法引擎,用户可以使用这些功能进行科学研究。

为了深入了解和快速上手 NVIDIA Riva 在构建语音方面的应用,英伟达联合机器之心推出「详解对话式AI应用服务框架NVIDIA Riva」三期线上分享,通过英伟达专家的理论解读和实战经验分享,向开发者展示如何使用 NVIDIA Riva 快速构建企业级 ASR 语音识别助手、快速构建企业级 TTS 语音合成助手、使用 Python 快速构建基于 NVIDIA Riva 的智能问答机器人。


2022年1月26日,系列分享第3期:
使用Python快速构建基于NVIDIA Riva的智能问答机器人

对话式 AI 是自动语音识别(ASR)、自然语言处理(NLP)、语音合成(TTS)一组技术的集合,通过语音和文字,能够实现人与机器设备之间的智能交互。基于对话式 AI 的系统可以通过识别语音和文本、在不同语言之间即时翻译、理解我们的意图以及以模仿人类对话的方式做出响应。

本次分享面向有会话式人工智能开发需求的开发者,将主要介绍以下内容:
  • 对话式 AI 简介
  • NVIDIA Riva简介与特性
  • 利用NVIDIA Riva构建语音识别模块,将语音问题转换成文字
  • 利用NVIDIA Riva构建智能问答模块,对问题进行回答
  • 利用NVIDIA Riva构建语音合成模块,将答案用声音说出来


直播时间:北京时间1月26日19:30-21:00


直播间地址:
https://jmq.h5.xeknow.com/sl/3bpGtM(点击阅读原文直达)

报名方式:进入直播间——移动端点击底部「观看直播」、PC端点击「立即学习」——填写报名表单后即可进入直播间观看。

直播交流群:每次课程均有答疑环节,识别下方二维码加入交流群。
如群已超出人数限制,请添加其他小助手:syncedai2、syncedai3、syncedai4 或 syncedai5,备注「Riva」即可加入。


点击阅读原文,立即报名。


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/126113
 
332 次点击