社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

直追ChatGPT?千亿AI巨头,火速升级大模型!

中国基金报 • 1 年前 • 546 次点击  

中国基金报记者 冯尧
         
距离首次推出多模态大模型刚一个月有余,科大讯飞又马不停蹄对其“星火认知大模型”升级。
         
6月9日,科大讯飞公布其通用大模型新进展,发布“星火认知大模型”V1.5版,该版本在开放式问答方面取得突破,多轮对话和数学能力再升级,文本生成、语言理解、逻辑推理能力也得到提升。此外,科大讯飞此次还将“星火认知大模型”搬上移动端,发布其星火APP。
         
早在一个月最初发布时,科大讯飞曾计划10 月24日前实现对ChatGPT的能力对标。据科大讯飞方面透露,下一步将在8月15日开放“星火认知大模型”的多模态交互升级。
         
瞄准待攻克的“三大缺陷”
         
在5月6日,科大讯飞首次公布“星火认知大模型”,当时科大讯飞董事长刘庆峰即为其立下目标:争取今年10月24日在中文方面超越GPT,在英文达到相当水平。
         
而34天后,科大讯飞对其进行了升级,公布了“星火认知大模型”V1.5版本。刘庆峰介绍,该版本在开放式问答方面取得突破,在多轮对话和数学能力再升级,文本生成、语言理解、逻辑推理能力持续提升。
         
         
尤其在泛领域开放式问答方面,“星火认知大模型”V1.5版本瞄准了纯大模型技术有待攻克的“三大缺陷”:新知识难以更新、事实类问答容易“张冠李戴”、史实传统典籍等容易“编造情节”。
         
同时,多轮对话能力的跃迁,让讯飞星火的对话体验更加贴合真人。多轮对话是大模型的传统难题,简单来说即为“没记性”。
         
在会上,科大讯飞也对“星火认知大模型”进行现场演示。在谈及“中国关于人工智能有何新动向”这一问题时。“星火认知大模型”提及今年6月3日,长三角企业家联盟产业数字化峰会发布了《通用人工智能长三角(合肥)宣言》和《通用认知智能大模型评测体系》。
         
实际上,星火大模型在5月已经定型,而“星火认知大模型”给出的答案,已经包括6月相关政策动向,也表明大模型已处于实时更新学习状态。值得注意的是,“星火认知大模型”还在答案中进一步给出了当下国内人工智能所面临的差距。
         
“大模型与搜索给出一样的答案没有意义,而是要通过专业知识、推理能力给出具有建设性的方案,”科大讯飞研究院院长刘聪也在会上直言。此外,“星火认知大模型”在会上还对今年高考的数学题和语文题作出准确作答。
         
下一节点:多模态交互再升级
         
按照计划,科大讯飞今年之内将进行三轮迭代升级,目标是在10月24日对标ChatGPT。6月9日之外,下一个升级节点是在8月15日,主要是突破代码能力和多模态交互再升级。在多模态方面,具体包括虚拟人合成、图文理解等,也将届时开放给客户使用。
         
科大讯飞董事长刘庆峰此前表示,目前科大讯飞的代码能力重点针对工业互联网,针对企业内部的很多应用,将来目标是不需要程序员,让大模型生成各种代码。但刘庆峰也坦言,星火大模型的这一功能和ChatGPT相比,还有很大差距,下一步升级的重点功能也是这一领域。
         
而刘庆峰在会上透露,在更为前沿的领域,科大讯飞方面还将探索更多潜在人工智能技术路线,如博弈智能、类脑智能和神经网络模型。
         
除了大模型自身能力进一步提升外,科大讯飞此次还发布了“星火认知大模型”在学习、医疗、工业、办公等领域进一步的商业落地进展,包括推出星火APP和星火语伴APP。
         
同时,科大讯飞还进一步瞄准了细分领域,推出星火认知大模型+医疗诊后管理平台、星火认知大模型+工业互联网平台、星火认知大模型+讯飞听见智慧屏产品。在业内人士看来,此举意在推动其在细分领域的商业化,有望率先突破的场景即为上述医疗、工业制造以及办公领域。
         
同时,除了面向不同应用场景开发示范性应用产品外,科大讯飞面向AI开发者、大模型上下游企业、创业团队的星火生态,也在同步招募生态合作伙伴。
         
实际上,参考OpenAI的发展史,大模型研发的前提是对小模型的研发、训练、应用等已经足够成熟,OpenAI创立之初的产品也仅为游戏领域的垂直小模型,在完全摸透小模型的研发、落地后才不断扩大参数量最终形成1750亿参数的大模型GPT3。
         
国内大模型开启“百模大战”
         
自今年3月以来,国内的通用大模型如雨后春笋般陆续发布。其中,百度率先发布文心一言,阿里紧跟其后官宣通义千问,甚至清华大学、北京智源人工智能研究院、上海人工智能实验室等科研院所也发布了各自的AI大模型成果。
         
根据民生证券相关研报的统计,目前国内至少已经有30多家大模型亮相,出品方涵盖互联网巨头、AI概念上市公司、服务器龙头企业、科研院所与一级市场创业公司,有的大模型的参数规模已经接近,甚至超越ChatGPT的规模(上千亿条)。
         
IDC预测数据显示,中国人工智能市场支出规模将在2023年增至147.5亿美元,约占全球总规模十分之一。长远来看,AI技术的创新迭代驱动了应用场景的进一步落地,以AIGC、数字人、多模态、AI 大模型、智能决策为代表的热点为市场带来了更多想象力和可能性。
         
IDC预计,2026年中国AI市场将实现264.4亿美元市场规模,2021-2026五年复合增长率(CAGR) 将超20%。中信建投认为,国内大模型研发应用热潮持续高涨,大模型发展全面加速,但当前全球大模型产业落地仍然处于早期探索的阶段,需要与下游的场景企业合作来建立大模型的商业模式。

编辑:舰长
审核:许闻



版权声明

《中国基金报》对本平台所刊载的原创内容享有著作权,未经授权禁止转载,否则将追究法律责任。


授权转载合作联系人:于先生(电话:0755-82468670)

刚刚,方星海重磅发声!

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/156133
 
546 次点击