Py学习  »  aigc

OpenAI上线Flex处理模式:API费用减半;微软发布可在CPU上运行的超高效AI模型BitNet丨AIGC日报

创业邦 • 3 月前 • 85 次点击  

1.【OpenAI上线Flex处理模式:API费用减半,牺牲响应速度及稳定性】为了更积极地与谷歌等AI竞争对手展开竞争,OpenAI宣布推出“Flex处理模式”新的API服务——用户以接受响应速度变慢和“资源偶尔无法分配”为代价,换取更优惠的模型使用价格。OpenAI表示,Flex处理目前已对新近发布的o3和o4-mini推理模型开放测试,主要面向模型评估、数据扩充、异步处理等优先级较低的“非生产”任务。采用Flex处理,API费用将直接减半。以o3为例,Flex模式下的费用为每百万输入tokens收取5美元,每百万输出tokens收取20美元。作为参考,标准价格分别为10美元和40美元。对于o4-mini,Flex模式的费用则从每百万输入tokens收取1.10美元、每百万输出tokens收取4.40美元,降至每百万输入tokens收取0.55美元和每百万输出tokens收取2.20美元。(IT之家)


2.【微软发布可在CPU上运行的超高效AI模型BitNet】微软推出全球最大规模的1-bit AI模型BitNet b1.58 2B4T,拥有20亿参数,能在普通CPU如苹果M2上高效运行。模型以仅-1、0、1的极简权重实现高内存和计算效率,在多个推理任务中超越Meta、谷歌等同类模型,速度更快、资源占用更低。惟一限制是需依赖微软自研框架bitnet.cpp,兼容性仍受限。(财联社)


3.【阿里开源通义万相首尾帧生视频14B模型】阿里开源通义万相首尾帧生视频14B模型,这是业界首个开源的百亿级参数规模首尾帧生视频模型。可根据用户指定的开始和结束图片,生成一段能衔接首尾画面的720p高清视频。满足延时摄影、变身等视频生成需求。(每日经济新闻)


4.【字节跳动开源云原生调度框架Godel-Rescheduler】4月18日,字节跳动技术团队宣布开源Godel-Rescheduler,一个适用于云原生系统的全局最优重调度框架。据介绍,Godel-Rescheduler由两个核心模块组成:Policy Manager和Movement Manager。其中,Policy Manager负责输出重调度决策,而Movement Manager则负责拆解并执行这些决策。整个框架的目标是通过重调度,使集群朝向全局最优状态发展。(IT之家)


更多AIGC资讯……

扫码订阅AIGC产业日报,
精选行业新闻,帮你省时间!👇

此外,如果您还想查公司、找项目、看行业,深入了解人形机器人、商业航天、AGI等热门赛道,欢迎加入睿兽分析会员,解锁相关行业图谱和报告等。(活动期间加入会员可免费获赠一份产业日报)👇👇



Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/181262
 
85 次点击