OpenAI停止在中国的API服务将会带来国产AI的崛起。
文 | 钱丽娜
ID | BMR2004
今年2月7日,美国加州议会拟定了《SB-1047前沿AI大模型安全创新法案》。经过4个月6次修订、审议,该法案距离正式发布已经很近。这意味着,基于美国开源大模型开发的应用可能面临着釜底抽薪的风险。今年5月,商汤发布国产原创大模型“日日新5.0”,在中文大模型测评基准SuperCLUE中,成为首个超越GPT-4 Turbo的国产大模型。
6月12日-13日, 在《商学院》创办20周年之际,《中国经营报》《商学院》和中经传媒智库主办了2024中国企业竞争力年会系列论坛之“中国商业20年跃迁与创变 引领新商业文明”论坛。《商学院》杂志专访商汤智能产业研究院院长田丰,就国产大模型的原创能力、基础研发的挑战进行了深入交流。在访谈最后,田丰特别提到科幻小说对科技发展的影响,从跨界的视角阐述商汤在走入无人区之后如何寻找灵感。
《商学院》:在开源大模型上搞应用,或是从头开始搞大模型原创,您认为这两种路线,哪一条更适合中国国情?
田丰:商汤自创业之始就立下‘坚持原创’的目标。从0到1的基础科研一定要做自研,而不是拿别人的开源大模型去改。
基础大模型代表一家企业从0到1的科技实力,如果基础大模型做不好,将影响从1到10,从10到100的产品化落地。商汤创始人汤晓鸥曾经在上海世界人工智能大会上用“源”一字来谈原创的重要性。他谈到,要想做基础科研的突破,就需要做技术源头,做与人工智能有关的伦理、政策、产品的策源地。
商汤早先布局了国产的训练框架。OpenAI的GPT-1.0训练框架是基于谷歌的TensorFlow和Meta的Pytorch,而商汤SenseParrots训练框架的每一行代码都是自己写的。
基础研发极具挑战,投入大、时间长,因此,科研领域要有战略科学家,他们是既懂产业,又懂商业,还懂科研的领军人物。战略科学家有清晰的底层思维,重点是决定什么做、什么不做。如中国航天奠基人钱学森就是战略科学家,当年国家决定“两弹一星”是导弹优先开发,原子弹居后。从人工智能的角度来讲,现在的“尺度定律”在极大地消耗算力、能源、数据和人力,我们要集中力量攻坚哪个方向?这的确非常考验战略科学家的眼光。
中美之间在人工智能基础大模型、基础智能体,甚至机器人操作系统等方面进行竞争,这些都将是未来基建的一部分。
但基础研发不应只是企业一家之事,国家、企业、产业链中的链主应该共同合作。在美国,微软负责行业解决方案,它会找专业领域的企业如英伟达配合,提供算力。OpenAI成立后,投资人投入耐心资本,10年后,OpenAI才逐渐摸索出与苹果合作的商业模式。这说明,企业是非常靠近市场的,考虑分阶段的基础科研与产业挂钩的时间段,其出发点是为了解决真正的产业问题。
钱学森说过“科研就是为了解决问题”,不解决问题的科研是没价值的,甚至为此主张工程院和科学院应该合并,产和研融为一体。
今年5月,商汤发布的原创大模型“日日新5.0”,在中文大模型测评基准SuperCLUE中,成为首个超越GPT-4 Turbo的国产大模型;在OpenCompass的基准表现中,客观评测超过GPT-4 Turbo,主观评测已超过GPT-4o位列第一。
评测榜单有40多个,商汤大模型打哪个榜单很重要。榜单的题每次要有大量更新,还有主观题、客观题。这些榜单就像高考,在过去的一年,GPT-4 Turbo始终排在全球第一名,无论Meta、谷歌还是国产大模型都在跟GPT-4这个基准线比。现在国产大模型商汤“日日新5.0”率先超过GPT-4o,成为现阶段新的基准。这代表了中国原创AI科研的一个阶段性成功,毕竟整个中国大模型一直都在追赶。
《商学院》:商汤如何搭建原创能力?
田丰:商汤大模型的原创能力有三点:人才第一、数据第二、算力第三。大模型是三者相互作用的结果。
人才第一 。我认为中国有三类AI人才非常重要。
第一类是像汤晓鸥老师这样的领军科学家,带动中国人工智能科研人才的培养。商汤从创立之始,就非常重视全球AI华人科学家的招募。商汤创业10年,初创时期的AI科学家们大多坚持至今,让“原创”精神代代传承。
第二类是青年科学家。这些人才通过社会招聘和学校招聘而来。商汤已经有一大批青年科学家走上大模型研发、产品研发和工程化的关键岗位。我们看到OpenAI也是依靠青年科学家组成的小团队取得了重大科技领域的突破。Sora的研发团队仅十几人,核心的两位领军人才是刚刚博士毕业2年内。所以,不管是物理学还是人工智能领域,25岁-35岁是一个天才科学家重要的产出时期,国内给予青年科学家科研重用与信任是关键。
第三类是从事基础研发的科研人才。商汤既开发基础大模型,也开发行业应用大模型。
由此,商汤形成的路径是:优秀人才成就基础研发,基础研发转化成为新型AI产品,AI产品催生跨行业的社会新质生产力。
数据第二。CV(机器视觉)领域,中国的场景规模比美国要大很多,丰富的场景时刻生成多样化的高质量数据。商汤因地制宜训练出来的公共服务大模型,覆盖智慧城市、智慧交通、智慧文旅、智慧医疗、智慧教育、智慧农业遥感等。场景大数据就大,数据大带来更优的模型。人们逐渐看到数据质量是比模型本身更关键的一个成功要素。中国多样化的场景数量实际上是美国的2~3个数量级以上,这就是中国人工智能基础科研的底气,因为中国有更长尾、更多元的训练数据。
算力第三。大模型训练采用的“尺度定律”(Scaling laws) ,“大力出奇迹”需要足够大的算力集群和足够多的训练数据集,才能产出更大参数量的模型,具备算力基础能力的民企同样肩负中国大模型基础科研创新的使命感和责任感。
商汤在2018年前后觉得小模型有很多长尾问题解决不了。为解决单一问题开发一个专有小模型,世界上的问题永远解决不完,因为永远有长尾低频的问题。这促使商汤思考,能不能做一个通用大模型来解决问题,但是当时面临的问题是,没有这么大的AI算力集群,包括公有云厂商也没有办法提供这么大的算力。商汤为此在上海临港投入56亿元建设SenseCore大装置,即AI数据中心,做成了长期稳定运行的万卡大集群,集群GPU的日常使用率能达到95%以上,而Meta公布的大集群稳定性数据是90%以上。这些底层的基础设施建设也很关键。
商汤开发大模型不是因为有了ChatGPT而研发,而是很早之前就在投入研发了。这几年商汤突飞猛进,在一些测试中超过GPT-4.0 Turbo、GPT-4o,都是因为金字塔的底座基础技术储备丰富,才能涌现出来一个又一个原创的技术成果。
《商学院》:商汤原创的基础大模型对行业大模型会有怎样的影响?
田丰:商汤大模型分为三个层级。日日新是基础大模型,其上是领域大模型,如中文语言大模型“商量”、文生图模型“秒画”、AI数字人视频生成平台“如影”、高精实景三维重建平台“琼宇”以及小物体建模平台“格物”,最上层是行业大模型,如营销、视频、法律、医学、广告、自动驾驶以及手机上使用的大模型,这些大模型的产业落地与国外是完全同步的。
现实情况是,人工智能的基础理论还在突破的前夜,但是在技术和产业变革两端都已经异常热闹。
商汤的基础大模型承载着各种前沿技术,包括十几个能力维度,如对话、文本理解、代码编写、数学逻辑、安全能力、伦理能力等。这些能力维度需要一一考核,就像一个木桶,每个维度的能力水平都很高,基础大模型才能实现产品化。
基础大模型好比发电厂,企业应用基础大模型时,只需把发电厂的电,即“智力”迁移过来,变成行业中小模型即可,而不必每家企业都建个“发电厂”。产业落地应用通常是十亿、百亿数据量的行业模型,而不是千亿、万亿级大模型。行业大模型集成的是专业经验,比如医疗大模型、法律大模型、电力大模型、铁路巡检大模型、锂电池质检大模型,它能帮助企业不必再从人员的基础知识积累做起,减少企业不必要的人员培训投入。
大模型走入行业带来的是真正的普惠化。以电商为例,传统的直播只能是大型企业、大品牌的天下,街边包子铺付不起坑位费。现在商汤在大量的视频平台上让“如影”AI数字人去带货,北京紫光园9.9元一套的牛肉馅包子一个月卖了10万份。这意味着中国有3000万小微企业,以及大量的个人从业者都能用得起大模型,从而降低原有的生产和营销门槛。
基于“商量”生成的营销大模型还会根据热搜去选品。目前已经选出9万多件商品,自动生成相应的营销文案,“如影”则帮助生成数字人直播卖货的视频,带来了全社会生产力的提升。新质生产力帮助边缘地带的小微企业不断地走向舞台中央。
《商学院》:目前大模型发展依靠的无限量的数据和电力,这种方式是否可持续?
田丰:先说尺度定律,OpenAI在一两年前就碰到了数据瓶颈,国产大模型也都意识到公开数据已经接近极限,而合成数据是一个重要方向。合成数据不是从0到1去编数据,而是在一道数学题的基础上,扩充出十道题,更像从1到10,所以合成数据的能力对于未来十年的训练数据规模是非常重要的。
商汤Piccolo2模型,就是利用合成数据的能力,找出很多负样本。负样本不包含任务所要识别的目标。训练负样本的目的是为了降低误检测率、误识别率,提高网络模型的泛化能力。对此,Piccolo2的水平甚至超过OpenAI,达到SOTA水平(SOTA指标通常表示当前在特定领域中最优的性能水平)。从这个角度讲,合成数据的能力基本上决定了未来大模型在数据层面的上限。
但这并不意味着数据的问题就此可以解决,像制造业的数据就在很多制造业企业的手中。英伟达开发“Omniverse”平台,要把制造业的数据放进数字孪生工厂,做人型机器人仿真模拟。目前,中国的制造业数据还处于孤岛之中,行业大模型不得不面对数据聚合的问题,这是国家数据局重点要解决的问题。
算力方面,大模型的发展的确受制于能源和算力瓶颈。未来芯片技术也许会诞生一个全新的摩尔定律,从算力翻倍变成能效翻倍。大模型所消耗的算力会达到十万块GPU甚至百万块的级别,这是小模型或者初期大模型想象不到的。
在解决算力问题上,商汤分成双轨进行,一是科研,二是技术。科研领域,商汤在上海临港的超大规模AIDC现有近4.5万块卡,约12000P算力,我们把它当成科研大装置。假如物理界没有大型粒子对撞机,科学家将没有办法发现α、β、Ω这些射线粒子,也没法发现暗物质,所以算力在科研领域一定是越大越好,因为尺度定律是目前唯一能够被实践证明的规律。
技术领域,各方在思考的是能不能通过工程化手段更节能,甚至在一个神经网络中训练时只激活其中的某一部分,不去占用更多的计算资源,因此,现在也出现了一些新架构。
未来各国AI基础设施竞争的是几十万块卡到百万块卡的超级AI计算集群,加入合成数据后的数据量将成千上万倍的放大,模型的参数量可达到数十万亿甚至百万亿级别,但也有可能走向另外的方向,一切取决于实验中得到的反馈。
商学院:人工智能起源于美国,商汤在从事原创的同时,如何考虑为世界做出创新性的技术贡献?
田丰:我一直认为,人工智能的上半场是知识工程,下半场是工业革命。
立足大模型要有三个维度的能力。
第一层是基础性的知识能力,无所不知,跨领域知识、融合贯通性强。
第二层是推理能力。现在大模型能做一些初步推理,但是100步、300步的精准复杂推理能不能做出来,这就需要连接主义和符号主义技术统一。符号主义主要应用于自然语言处理和知识表征推理,连接主义主要应用于图像和语音识别等神经网络。符号主义中,数学公式、逻辑公式都可以看成是一种文本语言。
第三层是执行能力。执行很重要,它将知识生产力变成物理AI,让人们可以在AI手机、AI PC、智能车上执行,也可以在编程智能体中去做各种辅助编程,例如商汤的代码小浣熊、办公小浣熊。商汤多模态大模型、智能体未来有可能与人形机器人合作,甚至其他具身智能机器人,如机器狗、工业领域的机器手合作,这将是黄仁勋所说的物理AI。但是怎么让它从知识型AI变成物理型AI,真正在物理环境里产生作用,而不仅仅是识别或者生成一个视频呢?因为识别视频更多的是识别运动轨迹,真正要在物理环境中做操作、做实验或者从事生产,还要了解运动学、动力学等学科,这是人型机器人重要的领域。所以,大模型的能力应从知识、推理到执行逐步递进,不断地往前突破,这也正是商汤在攻克的方向。
商学院:“恐怖谷理论”是一个关于人类对机器人和非人类物体的感觉的假设,在1970年被日本机器人专家森昌弘提出。森昌弘假设指出:当机器人与人类的相似程度达到一个特定程度的时候,人类对他们的反应会突然变得极其负面和反感。如果有一天人工智能具有人的推理能力、情感能力的时候,是不是会给人类带来“恐怖谷”的效应?
田丰:坦率地讲在机器人等领域确实有这个现象,但我觉得商业上很难推广。我有一个理论,“适人者生存”。对于AI来说,不管是智能体还是人形机器人,你不喜欢的AI或者机器人一定不会存在或者大范围推广,也不可能获得继续进化的机会。所以,现在的AI正在朝着两个方向发展,一个是与人类共事,不断地逼近物理世界,理解物理规律。另一个是与人类共情,满足人的精神需求,提供情绪价值。与人类共情的时候,如果人类不喜欢它,这个模型不会迭代下去。
人类所谓的希望用AI去替代部分脑力劳动甚至一部分体力劳动,是因为信任AI,然后给它更大的空间去做一定的决策和创造,所以要守住底线。
2019年,商汤在国内率先设立了伦理委员会,提出三个基本原则,以人为本、技术可控以及可持续发展。
哲学家波普尔说过有三个世界,我概括为物理世界、精神世界和赛博世界,现在的赛博世界大模型正在不断地逼近精神世界和物理世界。从这个角度来看,大模型已经跨过了让人类不适的阶段。
商学院:商汤的科学家从哪里寻找灵感?
田丰:商汤的CEO徐立博士的说过,首先要有想象力、好奇心,还得有反共识的能力,不能人云亦云,否则永远成不了第一。当闯入无人区时,科幻给了我们灵感。
商汤成立了一个科幻星球团队,邀请《三体》作者刘慈欣老师担任科幻星球的主任。为了让大家更有体感,我们把科技、科幻和科普融合到一起,在上海西岸凤巢建造了一个四千平方米的三体体验空间,同时容纳120人玩两小时的科幻剧本杀,内部环境取自《三体2》里的剧情。该剧情中,“引力波号”和“蓝色空间号”在追逐,三体的水滴想去消灭“引力波号”,阻止人类向宇宙发出三体星系坐标。这个场景融入了AR、VR、元宇宙、AIGC等新技术,AI创造出太空中的各种植物,甚至四维空间的体验感都创造了出来,这带给我们巨大的想象空间。
商学院:科幻对于科学发展的重要意义是什么?
田丰:美国前总统奥巴马的首席经济顾问Jason Fuman有一个重要观点:“能产生伟大科幻小说家的国家,通常能迎来30到50年的科技与产业繁荣。”我十分认同这一点。
我喜欢的科幻经典作品有《基地》七部曲、《三体》等,也读了很多刘慈欣、陈楸帆、韩松老师的新作。读《科幻世界》杂志的好处是,每个月都会有根据全球最新技术写出富有想象力的新鲜作品,比如围绕脑机接口的伦理问题而创作的作品,科幻小说向我们展示了未来产业的场景,帮助我们预判未来科技的走向,这是蛮重要的。
中国现在有全球领先的人工智能,有深海、探月、量子计算等重大工程,所以现在的科幻小说家有了中国人自己的技术自信和科技自信,从而打开了无穷的想象空间。国家科技发展与科幻发达是相辅相成的。领先科技带来的是更大的想象力和更广阔的想象空间,优秀的科幻作家又会带给科学家和工程师更好的产业创新思维。同理,上世纪前50年到70年,以欧洲和美国为主体的科技大突破带来了一批才华横溢的本国科幻小说家。
科幻是很好的科普,大众接受科普后,其实对国家新科技的拥抱和信任会更深。为什么国家会不断地投入基础科研?那是因为大家相信这就是人类的未来。
《商学院》:科幻小说算不算某种意义上的基础研发?
田丰:科幻小说通常是在一个想象空间中做“极限思维推演”,它把很多条件变成极限思维。读者曾问过刘慈欣老师,为什么科幻小说里的科技大多扮演着威力巨大的反派角色。刘慈欣说,这是为了让剧情更吸引人,不断地制造矛盾和冲突,如果是科技带来了乌托邦作品就不好看了。所以很多时候,人们在科幻小说中看到的都是有点悲观的废土世界和末日世界。
刘慈欣老师还说,科幻小说其实是存在错误的,因为科幻总是在科学上做延伸,延伸的过程一定有不少错误,因为它没有印证。但正是因为没有印证,才能去引领科学。所以科幻、科技和科普是一体的,大众更喜欢的是情感上的共鸣,而科幻电影也好,科幻小说也好,既能植入硬科技的知识,又能跟观众共鸣。《流浪地球》天然地填补了科学家思维和大众思维之间的鸿沟。所以我认为科幻是一个非常好的载体,只不过我们要用现在中国的原创技术去讲好中国的科幻故事,这才是科幻迷和科研工作者的使命。




版权声明:“商学院”所推送的文章,除非确实无法确认,我们都会注明作者和来源。部分文章推送时未能与原作者取得联系。若涉及版权问题,烦请原作者联系我们,与您共同协商解决。联系方式:18513373688,商务合作请加微信18513373688。