Py学习  »  aigc

OpenAI开放满血o1模型API,成本暴降60%;图森未来发布图生视频大模型“Ruyi”丨AIGC日报

创业邦 • 10 月前 • 136 次点击  


1.【OpenAI开放满血o1模型API,成本暴降60%】12月18日凌晨,OpenAI开启了第9天技术分享直播,正式发布了o1模型的API,并且对实时API进行大升级支持WebRTC。其中,o1模型的API与之前的预览版本相比,思考成本降低了60%,并且附带高级视觉功能;GPT-4o的音频成本降低60%,而mini版本价格更是暴降了10倍。同时OpenAI还发布了全新的偏好微调方法,通过直接偏好优化算法可以让大模型更好地掌握用户的偏好风格。(AIGC开放社区)


2.【豆包3D生成模型首次亮相:支持AIGC创作的物理世界仿真模拟器】12月18日举办的火山引擎Force大会上,豆包3D生成模型也首次亮相。该模型与火山引擎数字孪生平台veOmniverse结合使用,可以高效完成智能训练、数据合成和数字资产制作,成为一套支持AIGC创作的物理世界仿真模拟器。(新浪财经)

3.【图森未来发布图生视频大模型“Ruyi”】图森未来正式发布图生视频大模型“Ruyi”,并将Ruyi-Mini-7B版本正式开源,用户可以从huggingface上下载使用。据介绍,Ruyi是一个基于DiT架构的图生视频模型,它由两部分构成:一个Casual VAE模块负责视频数据的压缩和解压,一个Diffusion Transformer负责压缩后的视频生成。模型的总参数量约为7.1B,使用了约200M个视频片段进行训练。Ruyi是图森未来正式发布的第一款“图生视频”模型。(新浪财经)

4.【谷歌推出新一代视频生成模型Veo 2】美国谷歌旗下的“深层思维”公司宣布,推出新一代人工智能视频生成模型Veo 2,在视频分辨率与图像质量以及模拟真实世界物理规律方面大幅提升。该公司称, Veo 2可以创建4K分辨率、时长两分钟的视频,大幅领先美国开放人工智能研究中心(OpenAI)日前公布的最新视频生成模型Sora Turbo。据介绍, Veo 2能根据文本提示或参考图像生成视频,可以更真实地模拟运动、流体力学和光的特性,实现不同的镜头和电影效果,以及“细致入微”的人类表情。“深层思维”公司产品副总裁柯林斯表示,在接下来的几个月里,公司将继续根据用户的反馈对产品进行迭代。他承认目前Veo 2仍有不足,该模型生成视频的“连贯性和一致性尚需改进”,在生成复杂细节、快速复杂动作以及突破现实局限方面也有进步空间。(界面新闻)

5.【云天励飞:闪极AI拍摄记忆功能眼镜发布会即将举办】据悉,以“外置大脑、数字永生”为主题的闪极AI拍摄记忆功能眼镜发布会即将于12月19日举办,或成为国内首款量产的AI拍摄眼镜。今年11月份,闪极科技宣布完成数千万元人民币A轮融资,其中边缘AI上市企业云天励飞跟投。融资资金将主要用于公司战略级新品——闪极AI拍摄眼镜的市场拓展、AI技术研发及人才梯队建设等。云天励飞资本部总监贺鹤指出,智能眼镜作为可穿戴设备与大模型产品的结合,有望成为边缘AI时代的核心硬件和交互入口。云天励飞基于大模型能力和在行业应用中的积累,也将与闪极一起,推动智能眼镜在视觉语义个人助理和行业方面的应用探索。(证券时报)

更多AIGC资讯……

扫码订阅AIGC产业日报,
精选行业新闻,帮你省时间!👇


此外,如果您还想查公司、找项目、看行业,深入了解人形机器人、商业航天、AGI等热门赛道,欢迎加入睿兽分析会员,解锁相关行业图谱和报告等。(活动期间加入会员可免费获赠一份产业日报)👇👇



Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/177118