ChatGPT 能够引发如此广泛而热烈的讨论,除了因为 AIGC 能够促进产业发生巨大的升级和转型,也因为我们对人类是否会被 AIGC取代感到焦虑和担忧。人工智能专家李开复曾在 WISE 2016 独角兽大会上发表演讲,预测未来十年,世界上 50% 的工作都会被人工智能取代,包括翻译、记者、助理、司机、销售、客服、交易员、会计等。2023 年 3 月 15 日,OpenAI 发布了 GPT—4,信息处理能力有了大幅提升:能接受图像和文本输入,输出文本回复,并且文字输入上限大幅提升,回答准确性显著提高;能够生成歌词、创意文本,实现风格变化;能够以特定的角色、风格回答问题,各项性能均飞跃式提升。GPT—4 已经在各种考试和测试中具有了相当程度的人类的水平,甚至超过了很多专业的大学生,例如它通过了模拟律师考试,且分数排在应试者的前 10% 左右(图 5—4)。紧接着,微软发布了 Microsoft 365 Copilot,我们常用的 Offifice办公软件都得到了 GPT—4 的加持:Word 可以写论文了,PPT 可以根据文案自动生成了,Excel 也不需要输入公式了,等等。虽然这些功能还在进一步测试中,尚未推广,但这意味着我们的日常办公方式将被永远改变。不少媒体惊呼:“微软这是要‘革’全世界打工人的命?!”GPT—4 给很多行业和职业带来了极大的冲击,虽然具体的影响还需要时间去理解和消化,但无疑冲击是巨大的。已有不少人表现出消极态度:我们还有必要上大学吗?我们还有必要竞争各种资格吗?我们的工作机会还在吗?我们距离失业还远吗?人工智能商业化的落地先行者丁磊博士,在他的新书《生成式人工智能:AIGC的逻辑与应用》中,详细地解答了上述疑问。如前所述,ChatGPT 的重要意义在于标志着人工智能从决策式过渡到生成式,在认识论上人工智能已经从知识阶段过渡到逻辑阶段,更加接近人类思维,也更符合各领域应用的需求。这不免给人们带来恐慌,尤其是内容创作者:AIGC 能否取代内容创作者?AIGC 会抢走内容创作者的“饭碗”吗?
AIGC 带来的职业焦虑是完全能够理解的,也是确实存在的。如果说智能机器人取代的是重复性的体力工作,那么 AIGC 取代的就是需要创造性的脑力工作。目前已经有互联网大厂尝试用ChatGPT 自动生成业务代码和重构代码,也有设计师通过 ChatGPT 生成设计方案,再通过Midjourney 等其他应用生成设计图稿。如图 5—6,AI 绘画生成器网站 6pen 预测,未来五年 10%~30% 的图片为 AI 生成或 AI辅助生成,据此估算其市场规模可能超过 600 亿元。不可否认,AIGC 降低了内容创作的门槛,让创作者的范围更加广泛,很多脑中有画面、心中有故事的人都可以借助 AIGC 工具来表达自己了。而且,AIGC 了解任何领域,更像是一个创作全才,能够创作的领域和形式覆盖广泛。虽然 AIGC 创作的内容难以突破固有的瓶颈,不具有超越人类的新颖性,也可能出现错误,但是它的优势在于全面。像 ChatGPT 这样的 AIGC 应用在日常文字工作中还是十分有效的,尤其是针对重复、基础、有规律可循的内容,AIGC 可以替代人们完成很多烦琐的文案工作,诸如写报告、制表、检索等。这些文案内容创作要求较低,占用了创作者大量时间, AIGC 可以让人们从这些简单的内容生成中有效地解脱出来,提高工作效率。甚至面对编程、翻译等相对复杂的工作,AIGC 也已经达到了专业级的水平。当然也有人提出质疑,认为 ChatGPT 生成的内容仍存在很多的错误和逻辑不清的情况,甚至会出现“幻想”,编造并不存在的内容,也无法精确到执行层面被直接应用。基于“共生则关联”的模型训练标准,ChatGPT 无法拥有人的逻辑思考能力以及道德伦理观念,很可能出现虚假关联或者机械拼凑,并且需要源源不断地更新素材,而素材的来源本身就可能存在法律风险,生成的内容也可能存在侵犯著作权的问题。还有人对 AIGC 的原创性提出质疑,认为 AIGC 生成的内容是批量生产的模式化内容,没有真正的创作力,距离真正意义上的作品还差得很远。在 2023 年首期“之江院士讲坛”上,中国工程院院士、浙江大学教授潘云鹤表示,ChatGPT 虽能博览群书、出口成章、迭代提高,但依然缺乏独创性。爱奇艺前首席内容官、电视节目主持人马东曾在分享中提到,“内容与科技有本质的不同,它发自人心,解决人心的焦虑。我们通过技术手段去打开物质世界,但需要通过内容探索内心世界”。不同于人类创作的有感而发、情感由内而外的表达,AIGC 的创作来自素材和模型,通过分析海量素材,训练出特征和技巧,并将其应用于关联场景。
由于素材本身也都已经是被创作出来的内容,受制于更新的速度和算力,AIGC 不具有主观能动性,难以创作出真正的新内容或者新风格。AIGC 也无法像人类一样传递情感,做不到与人类感同身受,创作的内容机械化、同质化,缺乏人性温度,在价值倾向或者情感传递等方面力不从心。如果 AIGC 的发展会牺牲人类的创造力,那绝不是人工智能技术发展的初衷。现阶段,AIGC 会对内容创作者产生冲击,难以完全取代内容创作者,但可以对内容创作者进行辅助。在创作者创作前,AIGC 可以迅速计算出信息,搭建好内容框架,或者针对一个主题生成现有的内容模式和创作策略,以启发创作者,供其参考。这可以减少创作者构思和进行基础性创作的时间,也可以使得创作者快速了解创作领域的情况,更加注重内容的创意性、新颖性或者情感价值部分,极大地提升了创作者的创作效率,缩短了创作周期。例如,程序员通常需要花大量时间构建代码,由于编程环境中很多功能的写法是有定式的,所以 AIGC 可以大大缩短这种类型代码的写作时间,提高程序员的生产效率,使程序员可以将更多时间放在理解需求和构思框架上,从而节省执行层面的时间。AIGC 也会助力企业的创作成本大大减少,尤其是相关的人力成本,这必然会对内容创作者产生冲击,需要内容创作者创作速度更快、创作质量更高,水平在 AIGC 应用之上。但是,内容创作者也应该直面 AIGC,将其当作创作的帮手,训练其更好地辅助创作,将自己从基础工作中解放出来,突破创作瓶颈,从而提高内容创作的生产力和质量。人工智能是否会引发失业,是一个长期以来都被关注的话题,ChatGPT 的横空出世,只不过是加剧了这种担忧。不可否认,随着人工智能模型和硬件的提升,很多创造性低的工作将会被人工智能替代。但是,人工智能会取代谁?关于这一点,还得具体问题具体分析。人工智能对不同行业的渗透程度差异很大,各行业的算法模型、商业化程度、投资回报都不相同。例如,在零售、金融、安防等应用领域,人工智能已经比较成熟,可以实现商用及规模效应,可以进行策略制定并自动执行;在工业、教育、政务等应用领域,人工智能已经广泛应用,起到辅助性作用,效率得到有效提升;在交通、出行、医疗、文娱等应用领域,人工智能已经显现价值,但具体的应用仍需要进一步探索。人工智能在不同应用领域中起着不同的作用,渗透程度越深的行业,其从业者越容易被人工智能取代。而且,成本也是一个考虑因素,人力、算力等人工智能应用的成本仍相对较高,后期维护也需要投入人力和费用,还受制于法律和伦理的约束。剑桥大学研究者卡尔·弗雷(Carl Frey)和迈克尔·奥斯本(Michael Osborne)在分析人工智能对人力的可替代性时,引入了三个维度:社交智慧、创造力、感知和操作能力(图 5—7)。根据这三个维度,他们对美国 702 类职业可能被人工智能替代的概率进行了估计。结果显示,在这些职业中,有 47% 的职业可能在未来 20 年中受到人工智能的巨大冲击,涉及的人达到数千万。他们还分析了职业可能被替代的概率同职业从业者的受教育程度之间的关系,结果显示那些容易被替代的职业通常也是对技能和受教育程度要求更低的职业。我们分别来看一下社交智慧、创造力、感知和操作能力这三个维度。社交智慧指的是人和人交互的技能,包括同理心、谈判能力、社交洞察力等情感能力,对应的职业主要是教师、销售、心理咨询师、管理人员、社工等;创造力指的是原创能力和艺术审美能力,对应的职业主要是艺术家、作家、研发工程师等;感知和操作能力指的是手指灵敏度、协调操作能力和应付复杂工作环境的能力,包括专业能力、行业经验、工作效率、完成效果等,对应的职业主要是律师、医生、司机、美发师、急救人员、电工等。人工智能在处理不面对人、创新性和变通性较低的工作时,效率更高、稳定性更好,而面对需要情感交互、相对复杂场景或者需要创新性较高的工作时,就表现得不那么令人满意了。人工智能模拟的是人脑,但又不同于人脑。人工智能与人脑的相似点在于通过对过往的分析习得规律、得出结论,只是分析过往数据的过程与人脑是不同的。AI 与人脑的竞争也在于“有迹可循”的规律,面对规律性强的工作,AI 会表现出优势。因此,不难得出结论:面对事情本身的、重复性高的、有迹可循的、需要具体执行的工作最容易被人工智能取代;而需要面对人的、对创新性要求高的、情感交互多的、对专业经验要求多的、需要展现情感交流价值和领导力的工作最难被人工智能取代。 其实,真正能够被人工智能取代的工作很少,但是绝大部分职业都会受到影响。目前人工智能仍然只能完成部分工作,在很多环节还只是起到辅助性作用。但是它会提升效率,让我们从重复性的工作中解脱出来,对于部分技术要求低且重复劳动类职业,如数据录入、电话客服等,人工智能的工作表现已经十分突出了。但是对于人工智能是否能真正取代我们的工作,还应该理性对待,人工智能在很多领域带来的是岗位数量的调整。人工智能也会在产业升级中创造新的产品和市场,从而创造出新的岗位和就业机会,例如算法工程师、人工智能产品经理、提示词工程师、人工智能创意师、人工智能调校师等职业,这些职业的需求和数量也将逐步上升。普华永道 2018 年 12 月发布的《人工智能和相关技术对中国就业的净影响》估算,未来 20 年,中国现有约 26% 的工作岗位将被人工智能及相关技术取代,但是人工智能及相关技术通过提高生产率和实际收入水平,能够产生约 38%的新工作岗位,最终将净增约 12% 的工作岗位。因此,人工智能带来的是对职业结构的影响。“君子生非异也,善假于物也。”纵观人类的历史,就是工具化日益增强的历史。远古时期,人们偶然发现了“天火”;到石器时代,我们的祖先开始使用简单的木棒、石头;到农业革命时期,人们驯化牲畜、培育作物,诞生了农耕文明。后来,人们又经历了三次工业革命:蒸汽时代,蒸汽机改变了交通运输的速度,纺织机提高了工人的工作效率;电气时代,电力、钢铁、铁路、化工、汽车等重工业兴起;信息时代,计算机的诞生更是带来了翻天覆地的变化,全球信息和资源交流变得更为便捷。通过创新工具、解放生产力,人类从茹毛饮血到现在设计模型驾驭人工智能,一路从刀耕火种走到信息时代。2013 年,在德国汉诺威工业博览会上,德国第一次提出“工业4.0”的概念,之后美国提出了“再工业化”,中国提出了“中国制造2025”,这些宣示着第四次工业革命的开始,人类进入智能革命时代。如今 ChatGPT 和 GPT—4 出现,人工智能爆炸式发展,全球进入人工智能的大加速时代。人类的发展离不开各种工具的革新,如果没有这些工具,我们还在大自然的物竞天择中面临生存问题,而人类之所以能产生伟大的文明,也在于善于利用工具。我们每个人的成长,从嗷嗷待哺到独立行走,从学习知识到职业发展,也都是和各种工具息息相关的。比如你是数据科学家,就需要不断掌握新的模型和应用。当然工具是在进步的,我们和工具之间也是不断互动、相互促进的。在这个过程中,工具能够被进一步开发和创造,我们的劳动力也能够被进一步解放,激发出更大的发展和创造空间,这也正是我们进行工具创新的意义所在。AIGC 也是一场以数据为驱动、以提升生产力为目的的技术变革。作为研究和探索人工智能领域二十余年的从业者,我对于人工智能始终是乐观并充满信心的。人工智能带来的生产力和生产关系的改变势不可当,在这个过程中,我们必须保持一种开放的心态。对于人工智能给职业带来的影响感到焦虑大可不必,与其说人工智能将取代从业者,不如说它完成的是枯燥繁重的工作内容,它淘汰的不是人类,而是落后的生产力。对大部分人来说,人工智能不是竞争对手,而是我们的工作伙伴,它将成为必要的生产要素,使生产力倍增。我们应该做的是训练和使用人工智能,让人工智能为我所用,Work with AI(与人工智能一起工作)!当然,每一项新兴工具诞生之后,都必然经历一个从边缘产物到主流趋势的过程,一开始可能会面临质疑和非议,但在一次次打磨、提升并创造价值后,便登上了某个领域的顶峰。AIGC 的落地和应用还有待进一步探索,其技术本身也在不断迭代和进步。对我们每个个体而言,更应该做的是提升认知,充分认识到与人工智能共存是未来的必然趋势。人工智能是这一时代的产物,与其担忧它带来的诸多问题,不如拥抱并且掌控它。首先,应该拥有 AI 思维。所谓 AI 思维,本质是一种“数据驱动”的思维,就是从大量数据中形成模型,进而对未知情况做出最佳预测。在 AIGC 的应用中,则是从大量数据中形成模型,自动生成全新的内容。不管是决策式 AI 模型还是生成式 AI 模型,其基础逻辑都是一致的,只靠逻辑和经验难以推导,需要海量的数据进行训练。我们需要理解 AI 思维的底层逻辑,其基础在于数据,核心在于模型,实现在于算力,具体应用在于业务场景。拥有 AI 思维能够避免经验主义带来的主观、片面和限制,具有积极的意义。其次,应该拥有 AI 工具思维。所谓工具思维,就是善于利用工具,通过工具赋能,从而解决问题、提高效率、解放劳动力。而 AI 工具思维,就是掌握数据化思维,掌握使用 AI、训练 AI 的方法。AIGC 技术的发展已经不可逆转,与其消极对待,不如使之为我所用。我们要理解 AI 的底层逻辑,在工作和生活中使用 AI,挖掘 AI 技术的工具价值,并训练 AI 具有更强的适配性,为我们的工作和生活带来更大的便利,将我们从繁杂的事务中解放出来。未来,我们人人都可以是 AI 的使用者和训练师。从AIGC到AGI:AGI是新一轮的投资机遇吗?
ChatGPT 的“横空出世”让普罗大众对人工智能的突破有了新的认识,人们第一次看到人工智能系统能够完成各种各样的事情,不论是需要常识的闲聊,还是需要专业知识的论文写作,甚至写代码都在话下。ChatGPT 出现后,人们开始期待,它就是工业革命中的那台蒸汽机,轰鸣着开启 AGI 的时代。
AGI是什么?有什么用处?将向哪些方向发展?有哪些投资机遇?人工智能商业化的落地先行者丁磊博士,在他的新书《生成式人工智能:AIGC的逻辑与应用》中,就这些问题进行了详细的解读。
通用人工智能(Artificial General Intelligence,AGI)是指能够像人类一样在各种领域和任务中表现出智能的机器。AGI是人工智能(Artificial Intelligence,AI)的一个分支,也是AI的终极目标。AGI的研究涉及到多个学科,如计算机科学、认知科学、哲学、神经科学等,旨在探索智能的本质和实现方法。被喻为人工智能领域的圣杯。
可以说,目前的自然语言处理技术和大型语言模型确实展现出了一些 AGI 的影子,但距离真正的 AGI 还很远。因为 ChatGPT 等模型虽然已经具有智能对话、语言翻译、文本生成等实用功能,但它们仍然缺乏某些关键的特征和能力,例如跨模态感知、多任务协作、情感理解等,这些能力的缺乏导致了我们目前看到的 ChatGPT 在回答中尚有生硬之处,比如有时它的回答看似合理,却是错误或荒谬的,有时人们调整问题措辞后,会获得不同的答案,无法拒绝不合理及不道德的请求,等等。虽然 AGI 的到来仍未可知,但 ChatGPT 的出现已然被认为是一个重大的里程碑事件,如今,AIGC 在很多应用场景下都可以替代基础的脑力劳动,它的出现,将给我们的生活和生产方式带来颠覆性的变革。AIGC 生成的文本、图片、音频、视频、代码等多样化内容,在多样性、质量、效率三个方面推动了内容生产大步前进。当前的 AIGC 在文本生成、图片生成、视频生成等方面已经达到了堪称出神入化的效果。AIGC应用已经初步具备一定的生产力,可以说,此时正是AIGC发挥价值的时刻,目前,国外AIGC赛道已有8家独角兽公司,国内虽尚未看到与国外AIGC独角兽公司相匹配的收入产生。但多家机构已高度明确要将AIGC作为主投赛道,并推出了相应的孵化项目,预计本年度融资规模将有数倍增长。伴随底层大模型生态的逐步开放,商业价值的落地验证,预计到2024年左右,融资规模将出现首次阶段性的指数级增加。作为人工智能领域的一个中长期目标,AGI 技术要不仅能够执行特定任务,而且能够像人类一样通盘理解和处理各种不同的信息,这样才能成为具有与人类类似或超越人类智能的计算机程序。虽然ChatGPT 等模型在自然语言处理方面取得了一些进展,但仍然需要进一步研究和发展,才能逐步向着 AGI 的方向发展。
在《生成式人工智能》中,丁磊博士对AGI的未来研究投资方向做出了预测: 第一,跨模态感知。我们将平时接触到的每一个信息来源域称为一个模态,这些来源可以是文字、声音、图像、味觉、触觉等等。随着信息技术和传感器技术的发展,模态的范畴也变得更广:互联网上的文本,深度相机收集的点云等信息,都可以看作不同形式的模态。跨模态感知涉及两个或多个感官的信息交互,比如最基本的图像检索,就是一种从文本到图像的感官转换。反过来,从图像到语音的转换,可以帮助有视觉感官缺陷的人们,强化感知环境的能力。人类天然具有跨模态感知能力,能够对来自多种感官的信息进行整合和理解。而当前绝大部分的人工智能系统只能单独运用其中的一项作为传感器来感知世界,对于不同的模态,需要设计不同的专有模型。例如,根据文本生成图像的模型,采用的是将文本和图像进行联合编码的专有模型,这种模型无法适配声音生成等其他任务。各种模型之间无法真正打通是走向 AGI 的一大痛点。因此,研究如何让人工智能系统实现跨模态感知非常关键。第二,多任务协作。人类能够同时处理多个任务,并在不同任务之间进行协调和转换。当人们面对机器人时,一句简单的吩咐,比如“请帮我热一下午餐”“请帮我把遥控器拿过来”等等,这些指令听上去简单,执行时却包含了理解指令、分解任务、规划路线、识别物体等一系列动作,针对每一个细分的动作都有专门的系统或者模型的设计。这就要求机器人有多任务协作的能力。因此,多任务协作是 AGI最重要的研究方向之一,旨在研究如何让人工智能系统具有多任务协作能力,包括任务规划、任务选择和任务转换等,让“通用性”体现为不仅能够同时完成多种任务,还能够快速适应与其训练情况不同的新任务。第三,自我学习和适应。人类具有学习和适应能力,能够通过不断的学习和经验积累来提高自己的能力。因此,研究如何让人工智能系统具有自我学习和适应能力也是实现 AGI 的必要步骤。其中主要包括增量学习、迁移学习和领域自适应三个方向。增量学习就像人每天不断学习和接收新的知识,并且对已经学习到的知识不会遗忘,增量学习是指一个学习系统能不断地从新样本中学习新的知识,并能保存大部分以前已经学习到的知识,它解决的是深度学习中“灾难性遗忘”的问题:在新任务的数据集上训练,往往会使模型在旧数据集上的性能大幅度下降。迁移学习是人类的一种很常见的能力,例如,我们可能会发现学习识别苹果可能有助于识别梨,或者学习弹奏电子琴可能有助于学习弹钢琴。在机器学习中,我们可以把为任务 A 开发的模型作为初始点,重新使用在为任务 B 开发模型的过程中,即通过从已学习的相关任务中转移知识来改进学习的新任务。迁移学习的核心是找到并合理利用源领域和目标领域之间的相似性。在日常生活中,这种相似性是非常普遍的,例如,不同人的身体构造是相似的,不同产品的瓶身造型是相似的,不同品牌手机的唤醒方式是相似的。我们可以将这种相似性理解为不变量。以不变应万变,才能立于不败之地。领域自适应可以看成迁移学习的一种,旨在利用源领域中标注好的数据,学习一个精确的模型,运用到无标注或只有少量标注的目标领域中。它要解决的核心问题是源领域和目标领域数据的联合概率分布不匹配。比如,我们利用来自国内的汽车照片数据完成了模型的训练,这个模型已经能在这些汽车照片的分类任务上运行得很好了,但现在要把这个模型直接运用在国外的汽车上,效果可能欠佳。这时候就需要用到“领域自适应”,以实现模型的自适应迁移。第四,情感理解。能够理解并表达情感是人类最重要的特征,它在交流协作中甚至常常影响事件的下一步走向。图灵奖获得者马文·明斯基(Marvin Minsky)以及美国国家工程院院士罗莎琳德·皮卡德(Rosalind Picard)等科学家都认为机器必须拥有理解和表达情感的能力。当前,不少生成式对话系统的工作尚且将关注点集中在提升生成语句的语言质量,忽略了对人类情感的理解。因此,让人工智能系统理解情感,包括情感表达、情感分析和情感生成等,是实现AGI 的一个关键方向。第五,超级计算能力。实现 AGI 需要庞大的计算资源和超级计算能力。为了提升这一能力,人们从不同角度出发,采取多种方法不断推进:开发更高效、更可扩展的计算平台;采用分布式计算,将应用分解成许多小的部分,分配给多台计算机进行处理,节约整体计算时间,提高计算效率;采用边缘计算,在更靠近数据生成的物理位置收集并分析数据,不仅可以达到更高效的数据处理效果,而且能提供更高的安全性、隐私性和更快的数据传输速度。就像一辆汽车,人们不断升级油箱的容量、提高燃料的效率,以实现更远的行程。目前,我们期待通过 AIGC 与其他产业的多维互动、融合渗透孕育新业态、新模式,为各行各业创造新的商业模式,提供价值增长新动能。到了 AGI 时代,通用智能体能够处理无限任务、自己产生并完成任务,并且具有价值系统。如此,我们将迎来生产力的又一次解放,人们摆脱了信息处理和认知能力的有限性,可以将更多的精力集中在人工智能尚不能处理的方面。正如 OpenAI的 CEO、ChatGPT 之父山姆·阿尔特曼(Sam Altman)所说:“万物的智能成本无限降低,人类的生产力与创造力得到解放。推荐阅读
《生成式人工智能:AIGC的逻辑与应用》
中信出版集团
丁磊 著
2023年5月
ChatGPT问世,GPT-4即将接入未来办公软件……技术正在以前所未有的速度快速迭代,人类正在迎来新一轮的技术革命,企业、经济、个人发展将迎来重大变革。那么,这些技术背后的核心技术,生成式人工智能(AIGC),到底对企业、对商业有何影响,现在有着怎样的市场应用,已经催生了哪些经济,未来它的商业机会在哪里,我们个体未来如何把握发展机会?……这些问题对于我们理解当下,面向未来都十分重要。本书基于作者的专业背景和长期实践,在介绍生成式人工智能的技术逻辑基础上,着重分析其技术功能、市场应用及商业前景,将其与产业发展的实际相结合,帮助读者从本源了解未来趋势和发展机会。
你对“生成式人工智能:AIGC的逻辑与应用”怎么看?
欢迎关注公众号“互联网思想”并在本文评论区留言,精选原创留言最精彩+点赞最多的3位读者将有机会获得本书一本。活动限一周!

为伟大思想而生!
AI+时代,互联网思想(wanging0123),
第一必读自媒体
商务合作、投稿及内容合作,请联系后台小编
或271684300@qq.com