社区
教程
Wiki
注册
登录
创作新主题
社区所有版块导航
Python
python开源
Django
Python
DjangoApp
pycharm
DATA
docker
Elasticsearch
分享
问与答
闲聊
招聘
翻译
创业
分享发现
分享创造
求职
区块链
支付之战
aigc
aigc
chatgpt
WEB开发
linux
MongoDB
Redis
DATABASE
NGINX
其他Web框架
web工具
zookeeper
tornado
NoSql
Bootstrap
js
peewee
Git
bottle
IE
MQ
Jquery
机器学习
机器学习算法
Python88.com
反馈
公告
社区推广
产品
短视频
印度
印度
一周十大热门主题
老公和ChatGPT聊出精神病,她光速离婚
2025 Q1 AI 产品流量报告:国外 ChatGPT 霸榜,国内教育 AI 破局
张伯礼等6大院士共识,中医药+AI,大有可为!浙江中医药大学“网络药理学+机器学习+分子对接”,堪称...
【Python】拿来即用!9 个科研论文配图完整代码
免费插件 |QGIS深度学习实现语义分割、目标检测、超分辨率重建,直接提取建筑道路农田飞机等地物
6年年化收益46%,最大回撤率为16%的策略(附python代码)
dock2exe,将docker image转成exe可执行文件-20250508122233
机器人界「Sora」来了!清华、星动纪元开源首个AIGC机器人大模型,入选ICML2025 Spot...
Cogitate:意识科学研究项目简介
Python爬虫小白入门教程,学不会我给你刷鞋
关注
Py学习
»
chatgpt
宏景科技301396:ChatGPT多模态升级,ASR(语音识别)技术开启新里程碑
游资研报
• 1 年前 • 74 次点击
宏景科技301396:ChatGPT多模态升级,ASR(语音识别)技术开启新里程碑
9月25日晚,OpenAI宣布,将在ChatGPT推出新的语音和图像功能,新功能将于未来两周内面向Plus和企业用户推出。新功能允许用户将与ChatGPT进行语音对话(使用语音识别(ASR)和语音合成(TTS)技术),并在对话中以图片形式向ChatGPT展示正在谈论的内容(适用于所有平台)。
多模态理解力与输入输出是AI赋能各行各业的刚需。如教育和医疗领域的图像、文字识别;工业领域的场景识别;汽车自动驾驶等,本次更新将驱动大模型赋能的广度和深度进入新阶段,对国内同类型多模态语音技术的发展起到了引领作用。
①宏景科技的智能人机交互技术基于自然语言处理(NLP)、语音识别(ASR)和语音合成(TTS)技术,提供文本对话交互功能,能替代人工客服实现自助服务,帮助企业升级客服体验,提高服务效率,降低人力成本。
②公司与AR/A企业Rokid合作,通过各自技术共同构建跨场景、多任务、多模态的基础模型,在多模态融合之外,提高多模态模型的表征能力,从而缓解缺少大规模监督数据的挑战。
③宏景科技主要面向政府机关、事业单位、企业等客户提供在智慧城市解决方案,包括智慧医疗、智慧教育、智慧社区、智慧楼宇、智慧政务、智慧园区等,公司具备对数据要素进行收集、存储、加工、应用的技术储备。
风险提示:技术研发与升级不及预期;商用化不及预期
Python社区是高质量的Python/Django开发社区
本文地址:
http://www.python88.com/topic/162216
74 次点击
登录后回复