Py学习  »  aigc

OpenAI发布GPT-Realtime,AI Agent进入超逼真对话时代;腾讯混元开源视频音效生成模型丨AIGC日报

创业邦 • 4 天前 • 95 次点击  

1.OpenAI发布GPT-RealtimeAI Agent进入超逼真对话时代】OpenAI发布语音模型GPT-realtimeGPT-realtime是一个专用于语音AIAgent的多模态模型,能够生成更加自然流畅的语音,完美模仿人类丰富多样的语调、情感以及语速,支持图像理解并将其与语音或文本对话相结合使用,非常适用于客服、教育、金融、医疗等领域打造语音智能体。GPT-realtime还新增了MarinCedar两种极具特色的语音,同时对原有的8种语音也进行了全面升级。(新浪财经)


2.【设计基因编辑工具的AI大模型问世】中国农业科学院表示,其农业基因组研究所农业基因编辑技术研发与应用创新团队构建了全球规模最大的实验验证数据集,并基于此开发出人工智能(AI)大模型AlphaCD。该模型不仅能高效预测超过2万余种胞嘧啶脱氨酶的酶活特征,还能设计出新型高性能碱基编辑工具。相关成果日前发表于国际期刊《细胞研究》。(潇湘晨报)

3.【阿里巴巴旗下瓴羊发布数据分析Agent】8月28日,阿里巴巴旗下的瓴羊发布数据分析Agent,Quick BI里的“智能小Q”升级发布三大核心Agent能力——问数、解读和报告。Quick BI的完整Agent能力将于9月9日全面开放给所有的企业用户。(腾讯网)

4.【腾讯混元开源视频音效生成模型】腾讯混元正式开源端到端视频音效生成模型HunyuanVideo-Foley。据了解,用户仅需输入视频和文字描述,即可生成电影级高品质音效。即日起,用户可在GitHub和Hugging Face下载开源模型,或通过混元官网直接体验。(凤凰网)

更多AIGC资讯……


更多创投报告、数据分析,可点击睿兽分析小程序查看⬇️









此外,如果您还想查公司、找项目、看行业,深入了解人形机器人、商业航天、AGI等热门赛道,欢迎加入睿兽分析会员,解锁相关行业图谱和报告等。👇👇


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/186123
 
95 次点击