1.清华与星动纪元联合开源 AIGC 机器人大模型 VPP,该模型引入视频扩散模型泛化能力,能实时预测动作,提升机器人策略泛化能力。
2.月之暗面推出kimi-thinking-preview模型,具有多模态推理能力和通用推理能力的多模态思考模型,擅长深度推理,可帮助解决复杂问题。
3.OpenAI 发布新一代 GPT-4.1 模型及两个小型版本,性能显著提升,尤其在编码能力和指令跟踪方面表现突出,支持高达 100 万个上下文 tokens。
4.Qwen2.5-Omni-3B模型正式发布3B版本在长上下文序列处理(约25ktokens)中显存消耗减少超50%,可在普通24GB消费级GPU上支持长达30秒的音视频交互。
5.Al编程工具Cursor母公司Anysphere完成9亿美元融资,估值增长两倍多至90亿美元。Cursor可帮助开发者用自然语言生成代码、查错修复等,客户包括OpenAl、Midjourney等知名企业。
6.麻省理工学院与 Adobe Research 联合研发的 CausVid 模型可在几秒内生成高质量视频。它结合全序列扩散模型和自回归模型,通过“教师模型”指导避免错误累积,支持文本提示生成视频、静态转动态等功能。
想要了解更多AI 行业资讯以及ChatGPT和AI绘画实战案例,欢迎加入我们的「互联网AI早读课」知识星球!
在这个星球,你可以更加系统的学习AIGC相关知识:1. ChatGPT和AI绘画(Midjourney+Stable Diffusion+Photoshop beta)基础+进阶全攻略;3. 与200+行业先行者链接,积累你的专属人脉资源;现在加入,立享99元早鸟价优惠,星球用户每涨100人,价格上调100元,直到恢复499元原价!