社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

宏景科技301396:ChatGPT多模态升级,ASR(语音识别)技术开启新里程碑

游资研报 • 1 年前 • 74 次点击  

宏景科技301396:ChatGPT多模态升级,ASR(语音识别)技术开启新里程碑


9月25日晚,OpenAI宣布,将在ChatGPT推出新的语音和图像功能,新功能将于未来两周内面向Plus和企业用户推出。新功能允许用户将与ChatGPT进行语音对话(使用语音识别(ASR)和语音合成(TTS)技术),并在对话中以图片形式向ChatGPT展示正在谈论的内容(适用于所有平台)。

多模态理解力与输入输出是AI赋能各行各业的刚需。如教育和医疗领域的图像、文字识别;工业领域的场景识别;汽车自动驾驶等,本次更新将驱动大模型赋能的广度和深度进入新阶段,对国内同类型多模态语音技术的发展起到了引领作用。

①宏景科技的智能人机交互技术基于自然语言处理(NLP)、语音识别(ASR)和语音合成(TTS)技术,提供文本对话交互功能,能替代人工客服实现自助服务,帮助企业升级客服体验,提高服务效率,降低人力成本。

②公司与AR/A企业Rokid合作,通过各自技术共同构建跨场景、多任务、多模态的基础模型,在多模态融合之外,提高多模态模型的表征能力,从而缓解缺少大规模监督数据的挑战。

③宏景科技主要面向政府机关、事业单位、企业等客户提供在智慧城市解决方案,包括智慧医疗、智慧教育、智慧社区、智慧楼宇、智慧政务、智慧园区等,公司具备对数据要素进行收集、存储、加工、应用的技术储备。

风险提示:技术研发与升级不及预期;商用化不及预期

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/162216
 
74 次点击