Py学习  »  aigc

AIGC/AGI, 中文互联网不得不争!

量子学派 • 1 年前 • 130 次点击  


不得不说:中文世界正面临一次危机。

这次危机的源头,正是ChatGPT发起的冲击。


在人工智能这个领域,过去中文世界以为自己很强。

但是ChatGPT一出现,原先竞争的平衡就被打破。

曾经以为东西方世界的“并驾齐驱”,瞬间变成“追赶者”。


所以很多人在问一个问题:

为什么ChatGPT没有诞生在中国?

这样的提问很正常,很多人都在担心,人工智能时代,中文会不会被摒弃。

我们会在本文中回答这个问题,中文在AI时代有机会最终超越吗?


特别是在逆全球化横行,动辄鼓吹文明脱钩的岁月。

如果技术上没有跟上,可能会失去一个新时代。


好消息是,不仅国内科技公司开始进入大模型竞争,甚至模型下游的一些产品开始陆续推出。

比如,今天钉钉便率先利用阿里千问大模型,整合成为一个智能化的生产力工具

这种主动出击,敢于挑战,值得鼓励。


因为面对以ChatGPT为代表的AIGC/AGI世代,中文互联网不得不争!

AIGC,中文互联网不得不争!




1

不讲理的ChatGPT

说封杀就封杀


中文世界要争AIGC/AGI领域,不仅是宏观需要,也是个人诉求

ChatGPT出现后,国内很多人是体验不到的(禁止国内IP注册)。

而就算你“跋山涉水”成功了,也没有任何保障,说封杀就封杀。


从3月底到四月初,ChatGPT状况频频:

大规模的封号,以及暂停用户注册。

其中封号涉及的多是亚洲用户,特别是中文地区用户。



就算开通了Plus会员,交了钱,说删号就删号。

这真不是站着赚钱,简直就是骑在用户头上赚钱。


其实不仅仅是ChatGPT,还有AIGC另一知名企业Midjourney体验也不友好。


那么为什么ChatGPT,或者说其背后的OpenAI敢这么做?

很简单,目前ChatGPT一骑绝尘,没有其它公司可以制约它。




2

中文互联网

不能被“卡脖子”


尊重每一家世界级的科技公司,特别是类似OpenAI在技术上的原生态创造

中文世界要有自己的生态,有自己的文化,有自己的群体感受,以及自己种族的尊严利益


只有自己拥有ChatGPT的竞品,才有可能像移动互联网时代一样,东西方两个移动互联网世界形成良性竞争成长,这对全世界才有好处。


18世纪,蒸汽机带领英国人走进“蒸汽时代”。

欧洲大陆的法德,迅速跟进学习技术成为强国。

而中国沉迷于“田园时代”,最后结局可想而知。


很多人忧心忡忡:

为什么ChatGPT不是最早发生在中国?

背后其实是害怕:ChatGPT会成为新的“卡脖子”问题。



作为个人,首要反思自己,然后用善意来揣摩对方。

但作为整体,又不得不带着竞争性为群体考虑。


一旦被卡脖子,带来的可能是社会的整体性影响

就像芯片一样,在各个方面都要受制于人。

如果有一个ChatGPT中文镜像,就算不是那么杰出,但也得有自己的产品。


中文世界,有十几亿人口。

要有自己的“ChatGPT”,才能保护自己。




3

中文语言逻辑不同

打造我们的“ChatGPT”


在使用ChatGPT的过程中,有一个很大的感受:

英文提问与中文进行提问的对比,英文的回答质量会优质一些。


ChatGPT在中文语境下,有不少错误,还经常胡编乱造

比如问:

“风萧萧兮易水寒,壮士一去兮不复还”

这句话怎么理解?

它的回答是这样的:



这不能怪别人,ChatGPT毕竟是一个以英文为主体的生成式AI。

它的底层逻辑是将英文单词拆解成向量传入Encoder模块,而中文向量不可拆分


其实不仅仅是ChatGPT,目前大部分AIGC都是如此。

比如说Midjourney,这是一个AI绘画软件。

如果你想要用它画一幅具有中文意境的画,几乎是不可能的。


比如你想让它画一幅:

大漠孤烟直,长河落日圆。

结果出来是这样的:


维特根斯坦曾说:

语言的边界就是思想的边界。


语言代表的其实就是思想的表达可能性。

我们需要ChatGPT,我们也需要一个能够适应中文语言的“ChatGPT”。




4

大模型,中文互联网可以正面竞争


ChatGPT非常优秀,但并非真的是高不可攀

其实不仅仅是ChatGPT,整个AIGC也就是人工智能生成内容方面,中国的公司是有能力的。


1

ChatGPT属于“工程类竞争”

需要的是方向和经验

ChatGPT为人类作出最大的贡献是指明了生成式AI是可能的,只要方向明确了,我们迟早也会调出ChatGPT类似的产品出来。


2

华人在这方面的能力很强

无论是理论还是实践

ChatGPT背后的真正大佬:Transformer大模型。它是ChatGPT的基石,而看看Transformer论文,它的第一作者第二作者都是华人


而OpenAI团队里也有许多华人成员。比如毕业于清华大学的袁启明,是GPT-4项目数据集来源和处理团队的负责人。华人学者欧阳龙参与了ChatGPT中多个技术项目的研发工作。同时他还是InstructGPT论文的第一作者、RLHF 论文的第二作者。


3

中国在人工智能方面的基础并不弱

中国的人工智能产品,过去集中在实用性的计算机CV视觉工程上,对于自然语言大模型NLP的确缺乏远见,同时对生成式AI即AIGC更没有信心。现在方向已经非常明确,这方面中国企业和团队不会弱。


大模型,中文互联网企业一旦有了方向,是可以正面与最优秀的公司竞争的。




5

 给技术以文明⇌给文明以技术


技术是冷冰冰的,是文明的存在才能让技术焕发色彩。

所以从这一角度出发,技术永远是工具,而文明才是目的


文字代表文明,也是文明的载体。

文明是否能够跟机器融合,是否具有被机器提炼的价值,将是一大关键。

训练模型的核心,在于对其进行大量语料喂送,最终蒸馏知识,再加以传承

 举个例子:

上个世纪30年代,所有文明都面临一个问题——能否被计算机所读取

泰文比英文多三个字符,但因为文明弱势不可能要求打字机公司单独生产多三个键的硬件。

于是泰文自我阉割了3个字母,这个文明得以在现代化的历程中传承下去。


如何把文明融合到算法中,未来将关乎整个民族的传承。


以上,我们说的是给文明以技术

但是,也要反过来思考,给技术以文明


特别是AI,它需要学习不同的文明数据,这样才能让AI在chain of thought更进一步。 

未来AI最缺乏的可能是多元生态的文明,这就需要给技术以文明。

我们的文化底蕴决定了产出内容的下限不会低。




6

算法没有国界

但算法的控制者有国界


ChatGPT/AIGC背后是技术的连接,而最重要的一环是算法

当然算法是没有文明之分的,但给算法供给的原料是有文明之分的。

换句话说,算法是没有国界的,但算法的控制者是有国界的


由于政治文化经济因素,某些国家可能不愿意分享其最新的科技和研究成果,或者会对外国研究人员的合作提出限制和条件。


这些是事实存在的,但如果有更多国家拥有了这些技术,那么这项技术就有可能被放开,最终普惠到全世界




7

中国大模型——阿里,值得鼓励


所以,做属于自己的“ChatGPT”,有强烈的现实意义

即使一开始有差距,但国内做类ChatGPT的企业,都值得鼓励。

比如由阿里研发的大模型:通义千问


4月11日,通义千问在阿里云峰会上揭晓。

实际上,阿里在这方面已经深耕多年。

2019年,阿里启动大模型研发;

2021年4月,发布语言大模型“PLUG”;

2021年10月,训练出多模态M6大模型;

2022年9月,阿里发布“通义千问”大模型;

直到今年4月,通义千问正式发布。



作为阿里自研的语言模型,千问能够回答问题创作文字表达观点撰写代码


除了基本的文本生成和问答能力,千问还支持更多的定制化需求,可以针对不同的场景和应用进行扩展和定制,提供更加个性化的服务和解决方案。


千问还拥有丰富的技术积累,和内部资源支持,在性能和应用场景方面有着更为广泛的适用性。


很多人当然会拿来跟ChatGPT或者Midjourney比较,但跨出这一步,至少表明我们在积极拥抱生成式AI以及AIGC这一前沿技术的。


就如英国出现蒸汽机率先引领第一次工业革命,但法国并没有错过工业革命。


当然,除了大模型外,阿里还有一个更大的目标:

从大模型到落地场景,通过钉钉这类窗口,让人人都能体验AIGC。


就在今天,钉钉推出类Copilot的产品体系,成为中国首个走向智能化的生产力工具

虽然,还有不少提升空间,但打开了中国科技公司将大模型落地到生产场景的开端。




8

 中国AIGC超车的机会在应用层


人类过往生产力工具的进步,最终都是为了解放人类

解放人类的重复性劳作,让人类有更多时间去创造更多价值。

大模型下的AIGC可能会带来更多:它可能成为人类真正意义上的“延伸”部分

所以它最终还是要落地到应用层面,成为普及大众的技术。


每一波人工智能的发展,其实都存在一个关键鸿沟

那就是AI技术怎么落地到具体场景,落地到商业场景,落地成为真正的生产力

这一次也不例外,而这可能是中国AIGC超车的一个机会。


在互联网,以及移动互联网时代,中国最出彩的就是将顶层技术,落地到具体场景

蒂姆·伯纳斯·李发明了万维网,而我们移动互联网的超级应用大放异彩。

谷歌发明了手机安卓系统,而如今中国各个品牌的安卓手机畅销全世界。

二维码是日本发明的,但现在网络扫码支付技术成为中国的名片之一。


在这方面,我们并不担心,中国人在做应用上面,永远有着先人一步的敏感嗅觉。

支付宝微信钉钉小程序这样的应用,早已融入成为每个中国人生活的一部分。

那么,这一次如何让AIGC也能“飞入寻常百姓家”?


钉钉+千问大模型,是阿里给出的一个答案。




9

6亿人,人人可用AIGC


大模型带来的改变是革命性的,会带来新一轮的应用爆发和生产工具革命


4月11日,阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇认为,面向AI时代,所有产品都值得用大模型重新做一遍



阿里千问+钉钉的组合,让我们看到了一个希望:

芯片+模型+算力+应用场景的完整路线

钉钉目前拥有6亿用户,2300万组织,遍布各行各业。

目前来看,钉钉可以说是生产域最丰富的应用场景

这也是中文大模型快速进化的机会之一。


钉钉,中国首个走向智能化的生产力工具。

它让6亿人能够轻松体验到AIGC的神奇。

6亿人,不用爬梯子,就能体验大模型带来的变革。

6亿人,不需要中英文翻译,就能感受中文语境下的生成式AI。

6亿人,不需要任何技术门槛,有钉钉就能用。

这只是一个开始,当然有一些场景还是比较粗糙的。

但对于整个产业来说,钉钉的大模型接入,有它独特的意义。


未来真正的大协同是智能协同,这是协同办公、企业级SaaS领域新的机遇与挑战:

❶真正的大协同是智能协同。人工智能的技术进化,将带来极致的简单,工作交互、协同的过程将被机器取代。

❷每家企业都需要思考人与科技、机器的关系,坚定以人为本,让科技服务于人。

❸数据资产的价值不变,未来将产生无数的小模型,每个组织中的数据密度会快速增加,由 AI 处理数据


这会推动生产关系的变化,也会反向训练大模型的进化。




10

钉钉斜杠

创造一个“魔法世界”


那钉钉是怎么做的?

在阿里云千问大模型面世一周后,钉钉迅速推出类copilot能力

只用“/”,就能创造出一个“魔法世界”。



01


在钉钉文档中,“/”可以是用户的创意助理,比如帮助你拟标题写诗写故事润色文案生成海报等。




02


视频会议中,“/”也是会议助理,能一键生成讨论要点、会议结论、待办事项等。




03


在群聊里,新入群者无需爬楼,在对话框输入“/”即可自动整理群聊要点,快速了解上下文,并生成待办、预约日程。还可以用“/”在群聊中创作文案表情包等。




04


应用开发场景,通过“/”,可以用自然对话生成应用,例如投票应用,或者手绘表格、板书拍照后自动创建一个低代码应用,还可以对话修改应用内容。




05


用户也可以训练专属的助理机器人。用“/”创建机器人后,只需要发送文档、网页或者知识库的一条链接,就可以自动学习其中的内容,并生成对话问答,不用再去手动设置问题和答案。




就像Copilot,微软office借助OpenAI的ChatGPT,实现自我进化。

钉钉同样如此,利用千问大模型的能力,将生产力工具向上跃迁了一个新台阶。


AI时代,需要更强大的生产力工具。

钉钉,带来的变化,可能就只需要一条斜杆,就可以唤起与你相关的所有功能。




AIGC/AGI

中文互联网要主宰自身命运


ChatGPT爆火,中文世界出现了很多不同的声音。

它给中国人工智能领域迎头一闷棍,告诉我们什么是想象力和创造力,还有什么是坚韧的毅力。


ChatGPT的出现,被称为“第四次工业革命”,与蒸汽机电力互联网&信息技术并列,甚至还有一些人认为,它标志着人类新文明的出现。

我们知道,中国曾经失去前两次机会,所以在近现代文明中非常被动

我们把握好了第三次机会,才有了现在世界第二的实力。


其实也不容易,回溯上个世纪90年代互联网的接入,中文进入这个世界也是一个渐进的、逐步推进的过程。

王选汉卡,五笔输入,发展中文编码标准,发展中文输入法,发展中文网页技术等等,都充满曲折。


相比于互联网的接入,这一波AIGC/AGI浪潮,虽然也“任重道远”,但基础非常雄厚。

所以,我们尊重ChatGPT,但也要勇敢去挑战它。


中国科技公司,需要更多大模型技术,需要更多千问钉钉,将技术服务于生产、落地于商业。

只有这样,在AIGC/AGI世界, 中文互联网才能主宰自身命运


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/153723
 
130 次点击