百模大战：中国的ChatGPT有多强？

ChatGLM 是当前正在开发的数百个中文 AI 语言模型之一，其开发者表示，该模型在多个指标上的表现接近 ChatGPT。

图片来源：Pixabay

本文转载自公众号“自然系列”

原文作者：Celeste Biever

随着人工智能（AI）对话机器人领域的竞争日益激烈，中国科研人员在开发中文 AI 模型上取得了不少成就。其中领先的中文模型的包括 ChatGLM，这个模型的开发者认为其某些能力接近 ChatGPT，在中文上的表现甚至超过了 ChatGPT。

5 月 9 日在奥地利维也纳召开的国际表征学习大会（ICLR 2024）上，北京清华大学计算机科学家唐杰表示，“可以说，ChatGLM 是 ChatGPT 的替代。”

2022 年 11 月，美国加州旧金山的 OpenAI 公司发布了面向公众的基于大语言模型（LLM）的对话机器人 ChatGPT，LLM 随之火爆全球。如今，全球的科技巨头、初创公司和大学都在开发 LLM，这类模型能对文字提示给出回答，回答内容很像人类，而且言之有理。不过，虽然 ChatGPT 和它的许多竞争者能以多种语言回答，但大部分都由美国公司开发，并将英语作为主要语言。相比之下，ChatGLM 是一个双语平台，可以选择中文或英文。

鹏城实验室的计算生物学家 Wang Yu 说：“这是中国的明星模型之一。” 鹏城实验室是深圳的一个专注于技术的研究所。

清华大学和其技术成果转化公司智谱 AI——唐杰称估值超过 20 亿美元——开发了 ChatGLM 和其底层模型 GLM，GLM 是 General Language Model（通用语言模型）的缩写。唐杰说，智谱 AI 的 700 多名研究人员和工程师以及约 100 名清华学生正在参与 AI 语言模型的研发。

GLM 项目的规模超出了一些研究人员的预期。“我没想到中国学术界正在开展这么大的项目，”日本理化学研究所（RIKEN）先进智能研究中心主任杉山将（Masashi Sugiyama）说，“我太吃惊了。”

说中文的机器人

ChatGPT 在中国不能使用。但这不是研究人员开发本地替代版本的唯一缘由。唐杰说，中文 LLM 能输出更反映中国用户需求和偏好的结果，比如因国家而异的金融和教育信息。

他说这就好比用中国而不是西方的社交平台 app 来训练语言模型。他说：“微信基本上比 Snapchat 更了解中国人。”专为不同语言设计的模型能防止过度简化或忽视特定语言和文化的独有特征，位于巴黎的开源语言模型平台 Hugging Face 的社区领导 Adina Yakefu 说。

为了生成类似人类的回复，LLM 需要处理几十亿条句子，从中学习词汇间的统计学关联，这些资源通常来自网络。对话机器人还会基于人类训练者的反馈进一步优化。ChatGLM 的开发者会用专门的中文例子来训练它，并让说中文的人提供反馈[1]。

ChatGLM有英文和中文界面。来源：ChatGLM

仍需深究

唐杰说，这些中文数据来自网上，有些是向公司购买的。目前缺少可公开使用的中文数据集来训练模型，来自海口的 Hugging Face 工程师王铁震说。

开发非英语 LLM 还面临其他挑战。为了方便分析，大部分语言模型会将文本拆分成名为“词元”（token）的小单位。但中文词语间不用空格来分隔，这让分词（tokenization）变得很复杂，Wang 说。但唐杰表示，ChatGLM 使用的分词法与英文 AI 模型使用的几乎一模一样。

在 ICLR 2024 上，智谱 AI 用数据表示，ChatGLM 底层模型 GLM-4 的最优版本在多个标准上能达到 GPT-4 模型（OpenAI 的强大模型）得分的 90% 以内。这其中包括对通用知识、一般常识和数学能力的测试。ChatGLM 还在 LLM 面向中文的一个优化标准上打败了 GPT-4。唐杰表示，他们团队很快将发布一份关于 GLM-4 的技术报告。

加州大学洛杉矶分校的计算机科学家孙怡舟说：“我对他们能和 GPT-4 达到差不多的水准印象特别深刻。”

中国的 LLM 热

ChatGLM 网站发布了一个面向公众的中英文界面版本。有些 GLM 产品——包括更早的 GLM-130B 基础模型[2]和 ChatGLM-6b 对话机器人——都是开源的。这表示任何人都能下载并训练它们用于特定场景，科学家也能查看底层代码，研究它是如何运作的。

唐杰说，ChatGLM-6b 已被下载 1300 万次。该模型使用 60 亿个“参数”——这些参数是捕捉词语间统计学关联的单元，这个模型也是 ChatGLM 对话机器人中最小的。不过，GLM-4 模型和更大版本的 ChatGLM（有 1300 亿个参数）的内部运作方式和 ChatGPT 和 GPT-4 一样，是不开源的。

中国还在开发的 LLM 有几十种。Yakefu 说，2023 年中国推出了超过 100 个 AI 模型，“我们称之为‘百模大战’。”比如科技巨头百度和阿里巴巴都推出了自己的 AI 对话机器人。

中国的 LLM 需要遵守针对生成式 AI 系统的监管规定，这些规定自去年 8 月开始执行，要求这些模型符合社会主义核心价值观，并采取有效措施提升生成式人工智能服务，提高生成式内容的准确度和可靠性等。

Yu 将中国的规定与其他国家为保障 AI 系统安全的措施进行了比较。“在中国，整个国家坚持一定的价值观，”他说，“任何社会都有大家不谈论的内容，每个社会都有这些禁忌。”

通用智能

唐杰现在主要关注提升 ChatGLM 和 GLM-4 的能力。他将当前的系统比作“水中大脑”，因为它无法与世界产生物理互动。让 AI 系统在各种任务中具有人类的能力——被称为通用人工智能（AGI）的里程碑——就需要它们能在世界中具身化，他说。ChatGLM 能成为第一个实现 AGI 的 AI 系统吗？“我不知道，”唐杰说，“我希望我们能成为第一个，但我们还有很多竞争者。”

计算机科学家距离开发出 AGI 有多远，以及 LLM 是否会是实现 AGI 的技术，目前正被激烈讨论着。考虑到超智能 AI 模型对人类的威胁，AGI 是否是最理想的目标也众说不一。Yu 说：“AGI 不是你随随便便说的词。”

Yu 说，除了 AGI，AI 系统还有望解决全球变暖和预防下一次疫情等宏大挑战。他说，中国正在大力投入 AI 基础设施和技术建设。“我们相信我们有很大的机会能优化整个 AI 产业，并把这件事做好，”他说，“这不仅能造福中国民众，如果能减少能源消耗和二氧化碳排放，这将造福全人类。”

参考文献：

1.Hou, Z. et al. Preprint at arXiv https://doi.org/10.48550/arXiv.2404.00934 (2024).

2.Zeng, A. et al. Preprint at arXiv https://doi.org/10.48550/arXiv.2210.02414 (2024).

原文China’s ChatGPT: what a boom in Chinese chatbots means for AI标题发表在2024年5月22日《自然》的新闻版块上

© nature

Doi：10.1038/d41586-024-01495-6

本文由施普林格·自然上海办公室负责翻译。中文内容仅供参考，一切内容以英文原版为准。欢迎转发至朋友圈，如需转载，请邮件China@nature.com。未经授权的翻译是侵权行为，版权方将保留追究法律责任的权利。

▽ 精彩回顾 ▽

点个“在看”，及时获取最新学术资讯