Py学习  »  aigc

星图比特张炯:低成本专属模型定制训练服务是刚需,未来会走向细分工作流AIGC的产品化

共同虚拟 • 1 年前 • 220 次点击  


随着以ChatGPT为代表的预训练大模型展现出多产业应用可能性,国内大模型产品接连发布,围绕AIGC的探讨持续升温。

作为国内较早获得微软和OpenAI赞助的一家初创公司,星图比特在2022年就顺利接入OpenAI的API。公司目前位于上海漕河泾微软加速器。

成立于2015年的星图比特,是一家由上海树图区块链研究院与风语筑(603466.SH)联合投资的原生智能数字内容资产科技公司,主要业务为智能数字资产内容管理。目前,基于率先接入OpenAI API的先发优势,星图比特正为企业和机构提供细分模型定制服务。

作为一家目前同时接入OpenAI和部分国产大模型生态的初创公司,星图比特创始人张炯认为,现在到未来半年也是国内大厂的窗口期,虽然短期来说,国内去赶上和超越都很难,但从长期来说的话,国内的应用场景更多,数据生态更加完整,初创公司可能会更有机会。

作为国内区块链和生成式AI领域较早的从业者和接触者,张炯曾就职于IBM,长期服务大型金融机构。近期,由张炯主导编写的《一本书读懂AIGC》出版。他在书中提到,新的AI带来的是新的操作系统,这是一个时代的革命,会带来新的流量红利和机会。

张炯表示,AI模型可以提供很强的增效能力,并且具备固化自己公司核心业务的优势,未来星图比特的路径是产品化,目前产品正处于研发中。

  星图比特创始人张炯

 

中文大模型开发仍面临三大难点

 Q  作为同时接入open AI和国内部分大模型的公司,你怎么看目前国内中文基准的大模型开发难点?

张炯:主要三个难点,三个核心问题。

第一是工程师,前几年国内的算法工程师基本上都以计算机视觉为主,CV代表的公司有商汤科技和旷视科技。现在很多从业者基本上也都是从CV计算机视觉领域转行而来。NLP跟CV本质上是两个体系,算法训练、模型建模对于CV算法工程师来说,也是一个新的领域,所以人才方面有很大的缺口。

第二,国外目前做AI训练最好的GPU商用硬件是英伟达高性能计算的A100、V100。但是A100、V100目前因为中美之间的问题而对国内禁售,国内只能买到A800和V800,它们在训练模型或者说算法的训练效率上来说是只有 A100和V100的1/2和1/3。所以同样的资源,国内硬件在成本消耗上更贵。

第三,训练的数据和语料。中文本身在语料的逻辑上来说不如英文。英文有词根词缀,但中文是象形文字,所以从语法的训练上来说中文难度更大。这也是前段时间百度文心一言的主要的争议点之一。我觉得可以把模型训练当成一个小孩的培养,比如说教学英文,基本上都是先教他3000个单词,然后他的单词认知量在阅读和工作的场景下会提到4000、5000、6000甚至更多。


  Q  你怎么看待AIGC的“进化”,对于企业来说应用成本上又会呈现怎样的变动趋势?

张炯:进化非常快,一般而言,我比较赞同OpenAI的CEO奥特曼的观点,即从2022年开始AI的迭代周期将遵循新的摩尔定律——基本上AI算力每18个月左右的时间会翻一番。AI的进化速度非常快,但仍受制于硬件的供给。

从成本上来说,通用模型在个人用户使用中成本可能会有一定下降,我坚信整个AI研发和运营成本会越来越低,通用大模型也会越来越便宜,但它的降幅是有限的,因为最终它要受制于硬件和电力的成本。

对于企业而言,必然会训练自己基于大模型的细分工作流模型,回归正常值的企业投资产出比,才能让AI在企业端长久的被使用。 然后可能从1700亿个参数通过算法工程师优化至50亿参数,于是整个模型的运载效率和能耗成本都会大幅度地降低。模型参数越小,运行模型成本就越低。




可信AI将成未来主流
AI赛道门槛比互联网更高

  Q  如何看待国内公司在AIGC赛道的竞争力?

张炯:现在市场需求我觉得处在一个爆发的前期,现在其实也是给了国内这些大厂时间的窗口期,谁先出来谁就会占很大的市场,在未来半年是一个窗口期。模型经过一定时长的训练之后,表现会越来越好。模型表现处在一个爬坡期的过程当中,就会有越来越多的客户去接入。这也是国内纷纷抢先发布的原因。

虽然短期来说,国内去赶上和超越都很难,但从长期来说的话,我们的应用场景更多。我们这边的传统互联网的数据化做得更好,然后应用场景更多,长期的表现就放在可能5~10年。我们的表现其实会比他们要来的更强。

这一波AI,所有人都站在同一起跑线,对于大家来说,起跑线其实都是一样的,反而一些初创公司可能会更有机会,因为它的适配性更强,更加灵活,然后如果有很强的语料基础,基本上发展就会比较快。


  Q  如何看待AIGC后续的发展趋势?

张炯:首先我更关注的是可信AI和责任AI,因为现在基于transformer理论体系的 AI产品和应用都是离散式的。它生产出来的内容在很多时候不受人类控制,他可以胡说八道或者去引导人类做一些不该做的事。根本而言,AI没有伦理道德。所以未来基于控制论的可信AI和责任AI这两个理念会更多地被摆上主流技术界的研究和发展方向。

其次,商业化层面,因为在目前的AI赛道可能有很多初创公司创业,但是赛道的门槛其实比传统互联网的门槛高,核心点在于公司是否有自己的算法能力,但其实大部分公司只有产品工程能力,所以目前很多公司通过集成应用制作通用平台,但他们本身不具备算法。在商业化的领域,我相信可能在未来的一年或者两年时间会有一批公司倒掉,我也很关心整个行业的可持续发展的问题。



专属模型定制训练服务是刚需
星图比特未来发展路径是产品化

  Q  你的团队应该说是国内较早接触ChatGPT的团队之一,当时是在怎样契机下开始对接的?

张炯:我们作为一个初创公司,内部80%都是技术人员,剩下20%是公司运营。我们有算法工程师,但没有设计师,所以在业务过程中需要一些内容输出的时候,我们就用算法去解决设计的问题,这对于我们来说会比招个设计师更方便。后面我们就把解决设计问题的思路展现给了微软,并在去年6月份搬到微软加速器办公。


在2021年11月份的时候, OpenAI的API在微软云的market上线,那时候他们还缺乏生态,国内对它的关注度也没有那么高。

我们可能是国内在2022年11月以前唯一拿到OpenAI API接口的公司。现在申请基本上要排队,直到OpenAI开放账号才能获得使用权。但基本上国内的公司很难排到,因为OpenAI对国内的政策是比较保守的,对国内公司的支持力度没有像对海外公司支持力度这么大,所以就偏弱势,而且目前Open AI在微软云上获得的GPU资源也很紧张,所以对新的账号申请也是分批次开通。

所以从2022年11月份、12月份开始,随着AIGC热度骤增,我们开始把AI的能力以业务形式对外输出,因为很多公司有这方面的诉求。



  Q  星图比特怎么看 AIGC的应用前景,后续在AIGC上有怎样的规划?

张炯:截止3月,星图比特提供的主要服务还是企业端专属模型的定制训练服务。我们从2022年12月份开始推出到现在其实需求量是非常大的,大家都了解到AI模型可以提供很强的增效能力,而且更重要的一点是固化自己公司核心业务的优势。

举个例子,比如出版公司或一些泛内容公司,它最大的阻碍是人员流动所带来的内容产出的不稳定性,在公司成本固定的前提下,内容缩水会导致公司营收下降。而基于AI可以很好地把基于传统工作流的能力进行固化,通过模仿原作者内容给这些创作者灵感,从而保证内容作者产出的持续性。

因为接触的早,所以很早就对各个模型的能力有了比较深度的了解,之后我们也将根据各个模型的特性再研发我们自己的产品,未来路径肯定是产品化。目前文字处理的应用方向也是我们重点发展的方向,因为NLP自然语言处理是我们公司的在算法这个领域的核心能力。

Hello!

我们在为更加闭环、更加高效的服务模式做准备

欢迎加入限定白名单

与我们一起探索



数字人“竞技”百万身价虚拟人 柳夜熙  | 聆秋Rozy | 小K直播姬 | Ziva Dynamics 小度 | 韩国的“虚拟人”Fable | 日本的“虚拟人 | Hikky|超次元 | “十五少女”| 爱化身 | 凌迪Style3D | 虚拟演员202 | 快手狐璃璃 | 数字员工 Jinn  ... ...


Rec Room 《堡垒之夜》 |《节奏光剑》《遗忘工程师》Syn City  | 《Pokémon GO》本土游戏UGC |《黑客帝国觉醒》体育游戏 | 主机游戏 | NFT游戏 | Gala Games | 《The Sandbox》| 《糖豆人》|《Play Together》 |  《职业时代》| 《Grimlord》| 《NFT ALL Stars》| 《方寸幻境》 | Gym Class | 《派对派》... ...


Cocos | Facebook |  | 腾讯 | 百度 | 微软XGP| 迪士尼 | Epic与苹果 | 索尼元宇宙观 |  | LG U+ | Roblox | 索尼 VTuber | 英伟达 | Unity | 育碧Scalar 腾讯云 |  派拉蒙 | Epic |  Adobe | 集英社 | Discord |PICO |Vertigo Games | LayaBox ... ....


世悦星承次世文化|火山引擎| avatar动图宇宙 |Inworld AI | Synthesia | Burlingame Studio | Liv |Twitch | Brave Group | Hour One  | 粒界科技  | Wonder Interactive |Sequin AR | Motion Matching | NTT XR | 三丽鸥 | Dark Slope| Atoms Labs|Space Date ... ... 


聂辉华教授| 王国成教授 | 姜进章教授 | 臧志彭教授 | 稻见昌彦教授 | 华策影视集团总裁 傅斌星 | Layabox创始人谢成鸿 | 陈永东教授 | 博采传媒创始人 李炼 | 七创社董事长 许怡然 | 蔚领时代 郭建君 |OUTPUT 刘茵梦... ...


AR市场趋势观察 海外产业观察  | 日本市场 | 全球芯片 |  韩国NFT | 体育IP进军元宇宙  | VR虚拟试驾 | Authentic Artists |  五感交流  | 3D 虚拟社交| VR开发工具| 元宇宙“综艺” | AIGC工具 | 体育产业 | ... ...


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/153734
 
220 次点击