正在赶超谷歌和ChatGPT的是……？

▲点击[MarTechCareer] → 点击右上角[...] → 点击[设为星标★]

第一时间获得最前沿的数据、营销、产品等内容

今年2月，Meta为学术界提供了能够理解会话语言的复杂机器学习模型，引发了人工智能发展的大爆发。几周之内，学者们就把这些模型变成了开源软件，为ChatGPT和其他专有人工智能软件的免费替代品提供了动力。

加州大学伯克利分校（University of California, Berkeley）计算机科学教授Ion Stoica表示，免费的人工智能模型现在在性能上“相当接近”谷歌和ChatGPT开发商OpenAI的专有模型，大多数软件开发人员最终将选择使用免费的模型。Stoica利用Meta的技术帮助开发了一个关键的开源人工智能模型。

如果Stoica是对的，开源AI可能会颠覆谷歌、OpenAI、微软（Microsoft）和其他出售专有模型使用权的公司的商业计划。相反，强大的人工智能工具可以让任何人以很小的成本使用，Meta也可以获得回报。

Stoica是利用Meta的研究开发Vicuna的学者之一，Vicuna是三月份发布的开源语言理解模型。Vicuna通过一个网站使用ChatGPT的数据，人们在这个网站上发布他们与OpenAI聊天机器人的对话。尽管如此，Vicuna的质量和开源人工智能的迅速发展促使谷歌高级工程师Luke Sernau警告同事，他们的公司在努力追赶OpenAI的过程中，专注于专有软件，可能会落后。

“如果有一个免费的、高质量的、没有使用限制的替代产品，谁会为一个有使用限制的谷歌产品付费？”Sernau在一份内部备忘录中写道。他写道，开源人工智能的发展正在“击败我们”，并补充说，“谷歌应该确立自己在开源社区的领导者地位”，并“放弃对我们模型的一些控制”。

这份备忘录引起了整个行业的共鸣，包括谷歌的一些员工，尽管它的论点可能夸大了开源人工智能的能力，低估了它的成本和其他风险。但大多数人工智能从业者都同意备忘录的结论之一，即Meta将从发布其模型中获益。Meta在内部使用AI模型进行内容推荐和广告定位。随着开发人员改进Meta发布的模型，Meta将能够将这些改进整合到其内部AI中。

今年4月，Meta首席执行官Mark Zuckerberg在与分析师的电话会议上被问及公司的战略时表示：“如果行业对我们正在使用的基本工具进行标准化，那就更好了，这样我们就可以从其他人的改进中受益。”

Meta发布的这些模型统称为LLaMA，不能合法地用于商业目的。但是，与Stoica一起开发Vicuna的伯克利大学研究生Lianmin Zheng说，Meta为研究人员提供了足够的信息，可以复制该模型用于商业应用。

谷歌并没有对人工智能软件采取完全专有的方法。早在ChatGPT出现之前的2020年，它就发布了一个开源语言模型T5，使开发人员能够构建可以完成翻译和摘要等任务的软件。它随后发布了一个更高级的版本，Flan-T5。但据斯托伊卡和其他从业人员说，Meta发布的软件使谷歌的模型得到了重大改进，这使得工程师们更有可能选择基于Meta软件的模型。

OpenAI的开源模型

谷歌在开源人工智能领域发挥更大作用的压力可能会因为另一个原因而增加。据一位知情人士透露，微软在人工智能领域的主要竞争对手OpenAI正准备向公众发布一种新的开源语言模型，该计划此前从未被报道过。目前尚不清楚OpenAI即将推出的开源软件是否会抢走Vicuna或其他使用Meta模型开发的软件的风头。但它不太可能发布一款能与它正在销售的专有机型GPT竞争的机型。尽管GPT的前两个版本是开源的，但该公司270亿美元的私人估值取决于未来最复杂的商业人工智能不是开源的。

OpenAI发言人没有回应置评请求。

像Vicuna这样的开源模型只需几百美元的培训费用，这让用户可以选择避免向软件提供商支付昂贵的费用。相比之下，谷歌、OpenAI和微软一直在出售对其专有模型的访问权，企业可以将这些模型用于一系列目的，包括自动化客户服务、总结医学研究或生成营销文案。去年，微软开始出售OpenAI开发模型的使用权，并向OpenAI投资了数十亿美元，而谷歌和亚马逊今年也开始向外部开发者出售自己的模型。

但最近几周，开源替代品激增。除了基于Meta软件的Vicuna等模型外，工程师还可以从德国非营利组织LAION以及Databricks和Stability AI等初创公司中选择其他模型。Stoica创建了一个网站，试图衡量那些开源模型与专有模型（如OpenAI的GPT-4）的质量。

Stoica是Databricks的联合创始人之一，该公司销售帮助数据科学家使用人工智能的软件。

与开源软件相比，谷歌仍然有两个优势，Stoica说。他说，如果谷歌利用其用户数据宝库（外部人员无法访问），它的模型可能会在内容推荐等一些特殊用途上表现得更好。（谷歌发言人表示，该公司并未在现有用户数据上训练其“基础”人工智能模型。）Stoica还表示，这家搜索公司在管理大型计算机基础设施方面的专长意味着，它将能够以更低的成本运行人工智能软件模型，包括为其云客户运行。谷歌上周宣布了一系列对Bard专有模式的改进，这是它对ChatGPT的回应。

与此同时，OpenAI在收集数百万人与ChatGPT互动方式的数据方面处于领先地位，这无疑有助于它改进人工智能软件，而且这家初创公司与微软达成了一项私下协议，可以使用微软的计算基础设施。

但开源人工智能软件将允许更多公司使用专有数据自行解决问题。Stoica说，例如，一家航空公司可以利用其数百万个客户服务电话的记录来创建自动响应。彭博社在3月份表示，它利用自己的数据来训练一个机器学习模型，该模型能更好地理解金融信息。根据开发人员运行的Discord服务器上的消息，工程师们一直在尝试用Vicuna进行创意写作和编程。

Stoica说，为了提高Vicuna的能力，Stoica和他的同事们正在努力增加其模型中的计算次数，这将有助于它完成涉及推理的任务，比如编写代码。开发Vicuna的小组是伯克利天空计算实验室（Sky Computing Lab）的一个分支，该实验室每年的预算为数百万美元，其中大约50万美元来自微软、谷歌和亚马逊等上市公司。

开源AI软件之前曾挫败过OpenAI的雄心。OpenAI通过发布和出售DALL·E 2的访问权限，抓住了互联网的想象力，当人们输入他们想要看到的东西的简单文字描述时，DALL·E 2就会产生原始图像，一个开源的替代品，稳定扩散，突然出现在人们的视野中。Stable Diffusion的突然崛起让人工智能界的许多人感到惊讶，包括OpenAI的员工。DALL·E 2并没有成为一个庞然大物。

Stoica说:“我看不出有什么理由不让大型语言模型遵循同样的模式。”

ChatGPT的诞生，引发了一波人工智能热潮，现如今又有成本较低的开源人工智能与之抗衡。而在人工智能中，自然语言处理占据了重要地位。如果你想踏入数据科学领域，就应该准备好掌握你在大学课程中错过的新技能，积极学习自然语言处理等技术，成为一名成功的数据科学家，以满足当前AI行业的最新需求。那么除了大学，还在哪里能学习这些必备技能呢？如果你想系统地学习自然语言处理，了解这项AI技术的更多应用，那千万别错过的MarTechApe携手谷歌美国软件工程师、东南亚独角兽公司Grab的资深数据科学家共同打造的《Python自然语言处理课程》，教你从0到1地学会应用超级广泛的NLP技术！

PYTHON

自然语言处理

课程介绍

1. 来自Google和Grab的课程主讲老师

2. 理论与实践相结合的课程安排

这门课共分6章节，每章节都由理论课程与编程实践两部分组成。确保每一位学员可以学以致用、真正理解课堂内容。在完成课程后，学员不仅对自然语言处理有了一定的掌握，同时也熟练运用Python编程语言。

完整的课程大纲

3. 课程适合人群与学员收获

适合人群

想要系统性学习自然语言处理，了解如何应用NLP解决文本分析问题的人
想学习如何用Python做数据科学项目的人
想在数据科学、人工智能等领域，找到职业方向的人
想进入高科技公司的人
虽然从没有过数据科学经验，但是想要用数据科学前沿技术来提升自己工作能力与求职竞争力的人（尤其是，当你的工作需要经常与用户调研、定性研究、文本分析打交道时，NLP可以大大提高你的工作效率！）
在工作/学习中需要与自然语言处理打交道的人（尤其推荐工作中负责AI产品的人来报名课程）
希望从其他行业领域转型到数据科学的人

你将获得

来自Google美国与Grab新加坡的资深数据科学家的一手经验输出
丰富的行业洞察与NLP的实际案例
学习理论的同时，熟练掌握Python并完成NLP文本分析
完成一份自己的NLP语义分析与主题模型
洞悉面试中的NLP真实考题，助力数据科学的求职进程

4. 价格

课程价格：¥399人民币

官网购买通道

还等什么，快来一起走进自然语言处理的世界吧！