不得不说:中文世界正面临一次危机。
这次危机的源头,正是ChatGPT发起的冲击。
在人工智能这个领域,过去中文世界以为自己很强。
但是ChatGPT一出现,原先竞争的平衡就被打破。
曾经以为东西方世界的“并驾齐驱”,瞬间变成“追赶者”。
所以很多人在问一个问题:
这样的提问很正常,很多人都在担心,人工智能时代,中文会不会被摒弃。
我们会在本文中回答这个问题,中文在AI时代有机会最终超越吗?
特别是在逆全球化横行,动辄鼓吹文明脱钩的岁月。
如果技术上没有跟上,可能会失去一个新时代。
好消息是,不仅国内科技公司开始进入大模型竞争,甚至模型下游的一些产品开始陆续推出。
比如,今天钉钉便率先利用阿里千问大模型,整合成为一个智能化的生产力工具。
这种主动出击,敢于挑战,值得鼓励。
因为面对以ChatGPT为代表的AIGC/AGI世代,中文互联网不得不争!
不讲理的ChatGPT
说封杀就封杀
中文世界要争AIGC/AGI领域,不仅是宏观需要,也是个人诉求。
ChatGPT出现后,国内很多人是体验不到的(禁止国内IP注册)。
而就算你“跋山涉水”成功了,也没有任何保障,说封杀就封杀。
从3月底到四月初,ChatGPT状况频频:
大规模的封号,以及暂停用户注册。
其中封号涉及的多是亚洲用户,特别是中文地区用户。
就算开通了Plus会员,交了钱,说删号就删号。
这真不是站着赚钱,简直就是骑在用户头上赚钱。
其实不仅仅是ChatGPT,还有AIGC另一知名企业Midjourney体验也不友好。
那么为什么ChatGPT,或者说其背后的OpenAI敢这么做?
很简单,目前ChatGPT一骑绝尘,没有其它公司可以制约它。
中文互联网
不能被“卡脖子”
尊重每一家世界级的科技公司,特别是类似OpenAI在技术上的原生态创造。
但中文世界要有自己的生态,有自己的文化,有自己的群体感受,以及自己种族的尊严和利益。
只有自己拥有ChatGPT的竞品,才有可能像移动互联网时代一样,东西方两个移动互联网世界形成良性竞争和成长,这对全世界才有好处。
18世纪,蒸汽机带领英国人走进“蒸汽时代”。
欧洲大陆的法德,迅速跟进学习技术成为强国。
而中国沉迷于“田园时代”,最后结局可想而知。
很多人忧心忡忡:
背后其实是害怕:ChatGPT会成为新的“卡脖子”问题。
作为个人,首要反思自己,然后用善意来揣摩对方。
但作为整体,又不得不带着竞争性为群体考虑。
一旦被卡脖子,带来的可能是社会的整体性影响。
就像芯片一样,在各个方面都要受制于人。
如果有一个ChatGPT中文镜像,就算不是那么杰出,但也得有自己的产品。
中文世界,有十几亿人口。
要有自己的“ChatGPT”,才能保护自己。
中文语言逻辑不同
打造我们的“ChatGPT”
在使用ChatGPT的过程中,有一个很大的感受:
英文提问与中文进行提问的对比,英文的回答质量会优质一些。
ChatGPT在中文语境下,有不少错误,还经常胡编乱造。
比如问:
“风萧萧兮易水寒,壮士一去兮不复还”
这句话怎么理解?
这不能怪别人,ChatGPT毕竟是一个以英文为主体的生成式AI。
它的底层逻辑是将英文单词拆解成向量传入Encoder模块,而中文向量不可拆分。
其实不仅仅是ChatGPT,目前大部分AIGC都是如此。
比如说Midjourney,这是一个AI绘画软件。
如果你想要用它画一幅具有中文意境的画,几乎是不可能的。
比如你想让它画一幅:
语言代表的其实就是思想的表达可能性。
我们需要ChatGPT,我们也需要一个能够适应中文语言的“ChatGPT”。
大模型,中文互联网可以正面竞争
ChatGPT非常优秀,但并非真的是高不可攀。
其实不仅仅是ChatGPT,整个AIGC也就是人工智能生成内容方面,中国的公司是有能力的。
ChatGPT属于“工程类竞争”
需要的是方向和经验
ChatGPT为人类作出最大的贡献是指明了生成式AI是可能的,只要方向明确了,我们迟早也会调出ChatGPT类似的产品出来。
ChatGPT背后的真正大佬:Transformer大模型。它是ChatGPT的基石,而看看Transformer论文,它的第一作者第二作者都是华人。
而OpenAI团队里也有许多华人成员。比如毕业于清华大学的袁启明,是GPT-4项目数据集来源和处理团队的负责人。华人学者欧阳龙参与了ChatGPT中多个技术项目的研发工作。同时他还是InstructGPT论文的第一作者、RLHF 论文的第二作者。
中国的人工智能产品,过去集中在实用性的计算机CV视觉工程上,对于自然语言大模型NLP的确缺乏远见,同时对生成式AI即AIGC更没有信心。现在方向已经非常明确,这方面中国企业和团队不会弱。
大模型,中文互联网企业一旦有了方向,是可以正面与最优秀的公司竞争的。
给技术以文明⇌给文明以技术
技术是冷冰冰的,是文明的存在才能让技术焕发色彩。
所以从这一角度出发,技术永远是工具,而文明才是目的。
文明是否能够跟机器融合,是否具有被机器提炼的价值,将是一大关键。
训练模型的核心,在于对其进行大量语料喂送,最终蒸馏知识,再加以传承。
上个世纪30年代,所有文明都面临一个问题——能否被计算机所读取。
泰文比英文多三个字符,但因为文明弱势不可能要求打字机公司单独生产多三个键的硬件。
于是泰文自我阉割了3个字母,这个文明得以在现代化的历程中传承下去。
如何把文明融合到算法中,未来将关乎整个民族的传承。
以上,我们说的是给文明以技术。
但是,也要反过来思考,给技术以文明。
特别是AI,它需要学习不同的文明数据,这样才能让AI在chain of thought更进一步。
未来AI最缺乏的可能是多元生态的文明,这就需要给技术以文明。
我们的文化底蕴决定了产出内容的下限不会低。
算法没有国界
但算法的控制者有国界
ChatGPT/AIGC背后是技术的连接,而最重要的一环是算法。
当然算法是没有文明之分的,但给算法供给的原料是有文明之分的。
换句话说,算法是没有国界的,但算法的控制者是有国界的。
由于政治、文化和经济因素,某些国家可能不愿意分享其最新的科技和研究成果,或者会对外国研究人员的合作提出限制和条件。
这些是事实存在的,但如果有更多国家拥有了这些技术,那么这项技术就有可能被放开,最终普惠到全世界。
中国大模型——阿里,值得鼓励
所以,做属于自己的“ChatGPT”,有强烈的现实意义。
即使一开始有差距,但国内做类ChatGPT的企业,都值得鼓励。
比如由阿里研发的大模型:通义千问。
4月11日,通义千问在阿里云峰会上揭晓。
实际上,阿里在这方面已经深耕多年。
2019年,阿里启动大模型研发;
2021年4月,发布语言大模型“PLUG”;
2021年10月,训练出多模态M6大模型;
2022年9月,阿里发布“通义千问”大模型;
直到今年4月,通义千问正式发布。
作为阿里自研的语言模型,千问能够回答问题、创作文字、表达观点、撰写代码。
除了基本的文本生成和问答能力,千问还支持更多的定制化需求,可以针对不同的场景和应用进行扩展和定制,提供更加个性化的服务和解决方案。
千问还拥有丰富的技术积累,和内部资源支持,在性能和应用场景方面有着更为广泛的适用性。
很多人当然会拿来跟ChatGPT或者Midjourney比较,但跨出这一步,至少表明我们在积极拥抱生成式AI以及AIGC这一前沿技术的。
就如英国出现蒸汽机率先引领第一次工业革命,但法国并没有错过工业革命。
当然,除了大模型外,阿里还有一个更大的目标:
从大模型到落地场景,通过钉钉这类窗口,让人人都能体验AIGC。
就在今天,钉钉推出类Copilot的产品体系,成为中国首个走向智能化的生产力工具
。
虽然,还有不少提升空间,但打开了中国科技公司将大模型落地到生产场景的开端。
中国AIGC超车的机会在应用层
人类过往生产力工具的进步,最终都是为了解放人类。
解放人类的重复性劳作,让人类有更多时间去创造更多价值。
大模型下的AIGC可能会带来更多:它可能成为人类真正意义上的“延伸”部分。
所以它最终还是要落地到应用层面,成为普及大众的技术。
每一波人工智能的发展,其实都存在一个关键鸿沟。
那就是AI技术怎么落地到具体场景,落地到商业场景,落地成为真正的生产力。
这一次也不例外,而这可能是中国AIGC超车的一个机会。
在互联网,以及移动互联网时代,中国最出彩的就是将顶层技术,落地到具体场景。
蒂姆·伯纳斯·李发明了万维网,而我们移动互联网的超级应用大放异彩。
谷歌发明了手机安卓系统,而如今中国各个品牌的安卓手机畅销全世界。
二维码是日本发明的,但现在网络扫码支付技术成为中国的名片之一。
在这方面,我们并不担心,中国人在做应用上面,永远有着先人一步的敏感嗅觉。
支付宝、微信、钉钉、小程序这样的应用,早已融入成为每个中国人生活的一部分。
那么,这一次如何让AIGC也能“飞入寻常百姓家”?
6亿人,人人可用AIGC
大模型带来的改变是革命性的,会带来新一轮的应用爆发和生产工具革命。
4月11日,阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇认为,面向AI时代,所有产品都值得用大模型重新做一遍。
钉钉目前拥有6亿用户,2300万组织,遍布各行各业。
目前来看,钉钉可以说是生产域最丰富的应用场景。
这也是中文大模型快速进化的机会之一。
钉钉,中国首个走向智能化的生产力工具。
它让6亿人能够轻松体验到AIGC的神奇。
6亿人,不用爬梯子,就能体验大模型带来的变革。
6亿人,不需要中英文翻译,就能感受中文语境下的生成式AI。
6亿人,不需要任何技术门槛,有钉钉就能用。
这只是一个开始,当然有一些场景还是比较粗糙的。
但对于整个产业来说,钉钉的大模型接入,有它独特的意义。
未来真正的大协同是智能协同,这是协同办公、企业级SaaS领域新的机遇与挑战:
❶真正的大协同是智能协同。人工智能的技术进化,将带来极致的简单,工作交互、协同的过程将被机器取代。
❷每家企业都需要思考人与科技、机器的关系,坚定以人为本,让科技服务于人。
❸数据资产的价值不变,未来将产生无数的小模型,每个组织中的数据密度会快速增加,由 AI 处理数据。
这会推动生产关系的变化,也会反向训练大模型的进化。
钉钉斜杠
创造一个“魔法世界”
那钉钉是怎么做的?
在阿里云千问大模型面世一周后,钉钉迅速推出类copilot能力。
只用“/”,就能创造出一个“魔法世界”。
在钉钉文档中,“/”可以是用户的创意助理,比如帮助你拟标题、写诗、写故事、润色文案、生成海报等。
视频会议中,“/”也是会议助理,能一键生成讨论要点、会议结论、待办事项等。
在群聊里,新入群者无需爬楼,在对话框输入“/”即可自动整理群聊要点,快速了解上下文,并生成待办、预约日程。还可以用“/”在群聊中创作文案、表情包等。
应用开发场景,通过“/”,可以用自然对话生成应用,例如投票应用,或者手绘表格、板书拍照后自动创建一个低代码应用,还可以对话修改应用内容。
用户也可以训练专属的助理机器人。用“/”创建机器人后,只需要发送文档、网页或者知识库的一条链接,就可以自动学习其中的内容,并生成对话问答,不用再去手动设置问题和答案。
就像Copilot,微软office借助OpenAI的ChatGPT,实现自我进化。
钉钉同样如此,利用千问大模型的能力,将生产力工具向上跃迁了一个新台阶。
AI时代,需要更强大的生产力工具。
钉钉,带来的变化,可能就只需要一条斜杆,就可以唤起与你相关的所有功能。
AIGC/AGI
中文互联网要主宰自身命运
ChatGPT爆火,中文世界出现了很多不同的声音。
它给中国人工智能领域迎头一闷棍,告诉我们什么是想象力和创造力,还有什么是坚韧的毅力。
ChatGPT的出现,被称为“第四次工业革命”,与蒸汽机、电力、互联网&信息技术并列,甚至还有一些人认为,它标志着人类新文明的出现。
我们知道,中国曾经失去前两次机会,所以在近现代文明中非常被动。
我们把握好了第三次机会,才有了现在世界第二的实力。
其实也不容易,回溯上个世纪90年代互联网的接入,中文进入这个世界也是一个渐进的、逐步推进的过程。
王选汉卡,五笔输入,发展中文编码标准,发展中文输入法,发展中文网页技术等等,都充满曲折。
相比于互联网的接入,这一波AIGC/AGI浪潮,虽然也“任重道远”,但基础非常雄厚。
所以,我们尊重ChatGPT,但也要勇敢去挑战它。
中国科技公司,需要更多大模型技术,需要更多千问、钉钉,将技术服务于生产、落地于商业。
只有这样,在AIGC/AGI世界, 中文互联网才能主宰自身命运!