OpenAI在2022年11月30日发布的ChatGPT,在短短几个月时间风靡全球。今年3月14日,OpenAI再次发布更强大的多模态大模型GPT-4。其最大股东微软公司不仅宣布推出由ChatGPT支持的搜索引擎Bing和Edge浏览器。还宣布将GPT-4全面接入所有办公软件。在ChatGPT的带动下,全球科技公司掀起研究大型语言模型的热潮。国内最新跟上的要数百度了,3月16日,百度正式发布新一代大语言模型、生成式 AI 产品文心一言。在发布会上,李彦宏还展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成等使用场景中的综合能力。除了百度,最近还有多个大型语言模型密集发布。4月10日,昆仑万维宣布,其和奇点智源合作自研、中国第一个真正实现智能涌现的国产大语言模型——“天工”3.5发布在即,并将于4月17日启动邀请测试。该公司表示,“天工”大模型已经非常接近OpenAI ChatGPT的智能水平。4月11日,在2023阿里云峰会上,阿里云也正式发布了旗下的类ChatGPT大模型——通义千问。阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇表示,阿里巴巴所有产品未来将接入“通义千问”大模型,进行全面改造,钉钉、天猫精灵已率先接入通义千问测试,并会在评估认证后正式发布新功能。4月12日,商汤科技发布“日日新SenseNova”大模型体系,推出语言大模型“商量SenseChat”、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。据悉,作为千亿级参数的自然语言处理模型,“商量SenseChat”使用大量数据训练,并充分考虑了中文语境,能够更好地理解和处理中文文本。4月13日,亚马逊推出一项名为“Bedrock”的云服务,允许开发者使用类似于ChatGPT聊天机器人的人工智能系统。通过Bedrock生成式人工智能服务,亚马逊旗下云服务AWS将向开发者提供自家的语言模型“Titan”,以及来自初创公司AI21和谷歌支持的Anthropic的语言模型。这其中,一个Titan模型可以为博客帖子、电子邮件或其他文档生成文本,而另一个可以帮助搜索和实现个性化。此外,华为、腾讯也在大模型方面有所积累,华为最早于2021年便发布了华为云盘古基础大模型,包括NLP、CV和科学计算大模型。最近有消息称,华为云官网即将上线盘古系列AI大模型,分别为NLP大模型、CV等。不过华为云方面,并没有对此做出回应。腾讯很早就已经进行AI大模型的研究——混元AI大模型覆盖NLP(自然语言处理)、CV(计算机视觉)、多模态等基础模型和众多行业/领域模型。腾讯不久前表示,近期混元AI大模型团队也推出了万亿中文NLP预训练模型HunYuan-NLP-1T,实现在中文语言理解能力上的新突破,而且得益其低成本、普惠等特点,目前HunYuan-NLP-1T大模型已成功落地于腾讯广告、搜索、对话等内部产品并通过腾讯云服务外部客户。除了科技大厂,也有创业团队宣布加入大模型研究大军。4月10日,搜狗创始人王小川正式宣布入场大模型创业,和前搜狗COO茹立云联合创立人工智能公司——百川智能,要做的事情是打造中国版的Open AI基础大模型及颠覆性上层应用。王小川表示,有信心在年底发布国内最好的语言大模型。另外,还有之前很受关注的创业项目,美团联合创始人王慧文设立的光年之外科技公司。以及前商汤科技副总裁、通用智能技术负责人闫俊杰创办的Minimax。