1.【DeepSeek开源第四弹教优化,梁文锋参与研发】2月27日,DeepSeek开源周(OpenSourceWeek)第四弹来了,DeepSeek在X上宣布这次开源的是三项优化并行策略,并在Github上详细展开了DeepSeek-V3和R1模型背后的并行计算优化技术,通过这些阐述可以清晰了解团队是如何精细地优化计算和通信,最大限度利用GPU能力的。这三项优化并行策略其中包括DualPipe,这是一种用于V3/R1模型训练中计算与通信重叠的双向流水线并行算法,这种算法能够完全重叠前向和后向计算通信阶段,与传统方法相比减少了“流水线气泡”(设备在某些时刻的空闲等待)。在DualPipe的开发团队署名中,包括创始人梁文锋。(界面新闻)
2.【亚马逊Alexa+语音助手将采用Anthropic的Claude模型】当地时间2月26日,亚马逊宣布使用生成式AI重建Alexa语音助手,命名为Alexa+。Alexa+服务将收费19.99美元/月,亚马逊Prime会员可免费使用。人工智能初创公司Anthropic的Claude模型将为Alexa+提供支持。(腾讯网)
3.【Anthropic全面开放Claude AI的GitHub集成】Anthropic的Claude关系负责人Alex Albert于2月25日在X平台发布推文,宣布面向免费、Pro和Teams用户,开放GitHub集成Claude。GitHub集成此前仅限Claude企业版(Claude for Enterprise),为企业用户提供更强大的代码理解和辅助能力。集成方式主要为将GitHub代码库直接同步到Claude,让Claude能够理解代码库的上下文,帮助用户测试和调试代码、理解代码库并提供更有效的代码辅助功能等。(IT之家)
4.【微软Phi-4多模态及迷你模型上线,语音视觉文本全能】微软进一步扩展Phi-4家族,推出了两款全新模型:Phi-4多模态(Phi-4-multimodal)和 Phi-4 迷你(Phi-4-mini)。Phi-4多模态模型是微软首款集成语音、视觉和文本处理的统一架构多模态语言模型,参数量达56亿。在多项基准测试中,Phi-4多模态的表现优于其他现有的先进全模态模型,例如谷歌的Gemini 2.0 Flash和Gemini 2.0 Flash Lite。Phi-4迷你模型则专注于文本任务,参数量为38亿。(IT之家)
此外,如果您还想查公司、找项目、看行业,深入了解人形机器人、商业航天、AGI等热门赛道,欢迎加入睿兽分析会员,解锁相关行业图谱和报告等。(活动期间加入会员可免费获赠一份产业日报)👇👇
