1.【OpenAI开源浏览智能体评测基准BrowseComp】当地时间4月10日,美国开放人工智能研究中心(OpenAI)宣布开源包含1266个挑战性问题的基准测试BrowseComp。OpenAI表示,一个高性能的浏览智能体应该能够定位那些难以查找、可能需要在浏览数十甚至数百个网站的过程中才能获取的信息。现有基准测试(如SimpleQA)主要衡量模型检索基本孤立事实的能力,这类测试已被具备快速浏览工具(如支持浏览功能的GPT-4o)的模型所饱和。为了衡量AI智能体在互联网上定位难以查找、相互关联信息的能力,现开源基准测试BrowseComp。(搜狐)
2.【傅利叶发布首款开源人形机器人N1:开发者可实现完整复刻】4月11日,上海通用机器人公司傅利叶发布首款开源人形机器人Fourier N1,并同步开放完整本体资源包。N1身高1.31米,重38千克,不包含灵巧手,全身共23个自由度,最高奔跑速度达到每秒3.5米,最大关节扭矩96N.m,单次续航超过2小时。傅利叶表示,在工程验证环节,N1 已累计完成超过1000小时的户外复杂地形测试,单次连续运行时间超过72小时,全面验证了其结构设计的稳定性、耐久性与环境适应性。同时,N1 可稳定实现 15°~20° 坡度斜坡通行、20 厘米楼梯攀爬、及撑地爬起等高难度动作,同时“开源即ready”,开发者可实现 N1 的完整复刻,后续还将开放更多的算法模块。(澎湃新闻)
3.【OpenAI升级ChatGPT记忆能力,可调取历史聊天记录】北京时间4月11日,OpenAI宣布ChatGPT记忆能力大幅提升,能够参考用户所有的历史聊天记录,以提供更加个性化的回复。ChatGPT的记忆功能改进将从即日起逐步向所有Plus和Pro订阅用户开放。团队版、企业版和教育版用户将在未来几周内获得使用权限。(界面新闻)
4.【商汤发布多模态推理大模型,可生成6万字长思维链,10秒解说视频亮点】商汤技术交流日上,商汤科技发布了“商汤日日新 SenseNova V6(简称日日新V6)”,它具备最长64K思维链、多模态深度推理、全局记忆等能力,支持10分钟的视频推理及深度推理。(腾讯网)
此外,如果您还想查公司、找项目、看行业,深入了解人形机器人、商业航天、AGI等热门赛道,欢迎加入睿兽分析会员,解锁相关行业图谱和报告等。(活动期间加入会员可免费获赠一份产业日报)👇👇
