社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  aigc

OpenAI上线Flex处理模式:API费用减半;微软发布可在CPU上运行的超高效AI模型BitNet丨AIGC日报

创业邦 • 6 月前 • 113 次点击  

1.【OpenAI上线Flex处理模式:API费用减半,牺牲响应速度及稳定性】为了更积极地与谷歌等AI竞争对手展开竞争,OpenAI宣布推出“Flex处理模式”新的API服务——用户以接受响应速度变慢和“资源偶尔无法分配”为代价,换取更优惠的模型使用价格。OpenAI表示,Flex处理目前已对新近发布的o3和o4-mini推理模型开放测试,主要面向模型评估、数据扩充、异步处理等优先级较低的“非生产”任务。采用Flex处理,API费用将直接减半。以o3为例,Flex模式下的费用为每百万输入tokens收取5美元,每百万输出tokens收取20美元。作为参考,标准价格分别为10美元和40美元。对于o4-mini,Flex模式的费用则从每百万输入tokens收取1.10美元、每百万输出tokens收取4.40美元,降至每百万输入tokens收取0.55美元和每百万输出tokens收取2.20美元。(IT之家)


2.【微软发布可在CPU上运行的超高效AI模型BitNet】微软推出全球最大规模的1-bit AI模型BitNet b1.58 2B4T,拥有20亿参数,能在普通CPU如苹果M2上高效运行。模型以仅-1、0、1的极简权重实现高内存和计算效率,在多个推理任务中超越Meta、谷歌等同类模型,速度更快、资源占用更低。惟一限制是需依赖微软自研框架bitnet.cpp,兼容性仍受限。(财联社)


3.【阿里开源通义万相首尾帧生视频14B模型】阿里开源通义万相首尾帧生视频14B模型,这是业界首个开源的百亿级参数规模首尾帧生视频模型。可根据用户指定的开始和结束图片,生成一段能衔接首尾画面的720p高清视频。满足延时摄影、变身等视频生成需求。(每日经济新闻)


4.【字节跳动开源云原生调度框架Godel-Rescheduler】4月18日,字节跳动技术团队宣布开源Godel-Rescheduler,一个适用于云原生系统的全局最优重调度框架。据介绍,Godel-Rescheduler由两个核心模块组成:Policy Manager和Movement Manager。其中,Policy Manager负责输出重调度决策,而Movement Manager则负责拆解并执行这些决策。整个框架的目标是通过重调度,使集群朝向全局最优状态发展。(IT之家)


更多AIGC资讯……

扫码订阅AIGC产业日报,
精选行业新闻,帮你省时间!👇

此外,如果您还想查公司、找项目、看行业,深入了解人形机器人、商业航天、AGI等热门赛道,欢迎加入睿兽分析会员,解锁相关行业图谱和报告等。(活动期间加入会员可免费获赠一份产业日报)👇👇



Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/181262