随着人工智能(AI)对话机器人领域的竞争日益激烈,中国科研人员在开发中文 AI 模型上取得了不少成就。其中领先的中文模型的包括 ChatGLM,这个模型的开发者认为其某些能力接近 ChatGPT,在中文上的表现甚至超过了 ChatGPT。
5 月 9 日在奥地利维也纳召开的国际表征学习大会(ICLR 2024)上,北京清华大学计算机科学家唐杰表示,“可以说,ChatGLM 是 ChatGPT 的替代。”
2022 年 11 月,美国加州旧金山的 OpenAI 公司发布了面向公众的基于大语言模型(LLM)的对话机器人 ChatGPT,LLM 随之火爆全球。如今,全球的科技巨头、初创公司和大学都在开发 LLM,这类模型能对文字提示给出回答,回答内容很像人类,而且言之有理。不过,虽然 ChatGPT 和它的许多竞争者能以多种语言回答,但大部分都由美国公司开发,并将英语作为主要语言。相比之下,ChatGLM 是一个双语平台,可以选择中文或英文。
鹏城实验室的计算生物学家 Wang Yu 说:“这是中国的明星模型之一。” 鹏城实验室是深圳的一个专注于技术的研究所。
清华大学和其技术成果转化公司智谱 AI——唐杰称估值超过 20 亿美元——开发了 ChatGLM 和其底层模型 GLM,GLM 是 General Language Model(通用语言模型)的缩写。唐杰说,智谱 AI 的 700 多名研究人员和工程师以及约 100 名清华学生正在参与 AI 语言模型的研发。
GLM 项目的规模超出了一些研究人员的预期。“我没想到中国学术界正在开展这么大的项目,”日本理化学研究所(RIKEN)先进智能研究中心主任杉山将(Masashi Sugiyama)说,“我太吃惊了。”