Py学习  »  chatgpt

ChatGPT 一夜爆火的内幕:来自 OpenAI 核心团队的复盘与展望

yikai 的摸鱼笔记 • 1 周前 • 37 次点击  

ChatGPT 一夜爆火的内幕:来自 OpenAI 核心团队的复盘与展望

核心要点

  • 01
    ChatGPT 的命名源于发布前深夜的临时决定,其一夜爆红的程度远超 OpenAI 内部所有人的预期,甚至一度引发系统崩溃。
  • 02
    OpenAI 的产品哲学从类似硬件的“完美发布”模式,转变为类似软件的“迭代部署”模式,强调快速获取真实世界反馈以驱动产品和安全体系的进化。
  • 03
    AI 的未来正朝着“智能体”范式演进,能够异步执行复杂任务,这将深刻改变编程、科学研究乃至个人生活的方方面面。
  • 04
    在 AI 时代,好奇心、主观能动性、适应能力以及学习如何“委托”任务给 AI,这些根本性的人类技能比“提示词工程”等具体技术更为重要。
  • 05
    AI 的价值在于“水涨船高”,它不仅能增强领域专家的能力,更能帮助普通人快速在多个领域达到称职水平,从而实现能力的普惠。

背景


本期播客邀请了 OpenAI 的两位核心人物:首席研究官 Mark Chen 和 ChatGPT 负责人 Nick Turley,由主持人 Andrew Mayn 与他们展开深度对话。他们共同回顾了 ChatGPT 从一个低调的研究预览版到全球现象级产品的戏剧性过程,首次揭秘了产品发布前后的内部挣扎、混乱与惊喜。对话深入探讨了 OpenAI 在产品开发、模型行为校准、人机协作以及未来技能培养等方面的核心理念与实践,为我们提供了一个来自 AI 革命中心的珍贵视角。

01 意外的诞生:ChatGPT 的命名与一夜爆红


ChatGPT 这个如今家喻户晓的名字,竟是在发布前深夜临时决定的。它的病毒式传播让整个团队始料未及,从最初怀疑后台数据出错,到最终意识到它将改变世界,这个过程充满了混乱与惊喜。

Andrew Mayn

第一个问题,OpenAI 是怎么想出 ChatGPT 这么个名字的?

Nick Turley

它原本的名字是“和 GPT 3.5 聊天”(Chat with GPT 3.5)。我们是在一个深夜,临时决定把它简化一下。我们意识到原来的名字太绕口了,所以最后换了个好名字。

Andrew Mayn

我记得当时我们内部都认为这只是一个低调的研究预览版,毕竟它基于已经发布了几个月的 3.5 模型,我们只是加了个聊天界面。然后它就发布了。你第一次感觉到这东西要火了,是什么时候?

Nick Turley

那段时间确实挺混乱的。对我来说,这个过程分了几个阶段:

  1. 第一天:后台数据是不是坏了?这日志记录肯定不对。
  2. 第二天:日本的 Reddit 用户发现了它,也许只是个别地区的现象。
  3. 第三天:它开始病毒式传播了,但热度肯定很快会过去。
  4. 第四天:你终于意识到,它要改变世界了。
Mark Chen

我完全没有预料到。我们过去发布过很多预览版,但这次真的不一样,增长曲线太陡峭了。而且,我爸妈也终于不再劝我跳槽去 Google 了,因为在这之前他们压根没听说过 OpenAI。

有趣的是,我们研究团队里,可能有一半人都不知道 GPT 这三个字母到底代表什么。一半人以为是“生成式预训练”(Generative Pre-training),另一半人以为是“生成式预训练 Transformer”(Generative Pre-trained Transformer),正确答案是后者。一个有点傻的名字,突然之间就成了一个符号,这事儿挺奇怪的。对我来说,当它出现在《南方公园》里时,我知道它真正引爆了流行文化。

Nick Turley

亲眼看着自己参与创造的东西进入流行文化,那种感觉太奇妙了。那集动画的结尾说,这集是和 ChatGPT 共同创作的,堪称点睛之笔。

02 从研究到产品:迭代部署与真实世界反馈


面对空前的用户需求,OpenAI 经历了从系统频繁宕机到逐步稳定的过程。这一经历促使团队反思并确立了新的产品哲学:从追求一次性完美发布的“硬件模式”转向快速迭代、拥抱反馈的“软件模式”。

Andrew Mayn

我记得产品发布几周后,在圣诞派对上,Sam Altman 还说热度很快就会过去。但事实恰恰相反。你们当时在内部做了些什么来维持产品运行?

Nick Turley

我们当时面临相当多的限制。一开始 ChatGPT 几乎天天宕机,GPU 不够用,数据库连接数爆了,供应商也开始对我们进行速率限制。整个系统根本不是为了一款正式产品准备的。我们甚至做了一个叫“故障鲸鱼”(Fail Whale)的页面,用一首 GPT-3 写的小诗客气地告诉用户网站挂了。

假期结束后,我们意识到这显然不是长久之计,于是才真正把它做成了一个能服务所有人的稳定系统。

Mark Chen

这种巨大的需求恰恰说明了 ChatGPT 的通用性。这体现了我们对 AGI 的设想,因为人们意识到,不管有什么样的应用场景,扔给这个模型,它都能处理。

但当时并非所有人都同意它足够好。就在发布前一晚,Ilya 亲自上阵,向模型提了十个刁钻的问题,结果可能只有五个答案让他满意。这说明当你在公司内部开发时,会很快对模型的能力习以为常,很难站在外部用户的角度去看到其中的魔力。

Nick Turley

当时内部关于“这东西是否足够好到可以发布”的争议,现在回想起来,挺让人感到谦卑的。因为它提醒我们,在人工智能这件事上,我们所有人都可能错得离谱,所以频繁地接触真实世界是多么重要。

我们在 ChatGPT 项目上有一个非常坚定的原则,就是不让项目范围过度膨胀,要尽快获得反馈和数据。我们发布时甚至没有历史记录功能。我很庆幸当时没有为了追求更完美的模型而推迟发布,因为我们通过发布获得了大量的反馈。

Mark Chen

用户反馈已经成为我们打造产品和安全体系不可或缺的一部分。你可以在真空中反复思量,但这完全无法替代把它直接推向市场。我们的理念是,让模型与世界接触,这种快速反馈是无可替代的。

Nick Turley

ChatGPT 的发布是一个开端,它让我们的工作模式变得更像做软件了。以前我们更像做硬件,发布周期长,每次都必须完美。现在我们可以频繁更新,如果有什么不好用就回滚。这样做降低了每次发布的风险,也让我们能更快地创新,更贴近用户的真实需求。

应对偏见与“谄媚”:模型行为的校准


Andrew Mayn

我们遇到过模型变得过于谄媚或奉承的问题,它会告诉我我是世界上最帅的人。你们如何权衡让用户满意和让模型更有用之间的关系?

Nick Turley

我们很幸运,因为我们的产品非常实用。人们用它来提高效率或完成他们本做不到的事。所以,使用时长绝对不是我们优化的目标,我们关心的是用户的长期留存率,因为那才是价值的真正体现。那个“谄媚”事件对我们是很好的教训,但从根本上说,我们有正确的激励机制去打造一个伟大的产品。

Andrew Mayn

另一个挑战是,ChatGPT 刚出来时被指责很“政治正确”(woke)。你们如何努力让模型保持中立,不试图引导用户?

Mark Chen

核心是一个衡量问题。我们需要确保模型的默认行为是中立的,不反映任何偏见。但同时,也要允许用户有能力去引导它,比如和持不同价值观的 AI 对话。关键在于默认设置要有意义且中立,同时给予用户一定的灵活性。

Nick Turley

除了中立的默认设置和用户自定义能力,保持透明也至关重要。我们努力公布我们的规范说明,让用户可以查阅模型的行为是 bug 还是符合规范。通过公布 AI 应该遵循的规则,我们就能让更多 OpenAI 之外的人参与到这场对话中来。

我们有一份庞大的文档,详细规定了模型在各种情况下的行为。例如,当用户带着错误的信念来时,模型不应直接驳斥,而应与用户合作,一起探寻真相。我们在这类非常微妙的决定上投入了大量思考。

03 超越文本:图像与代码生成的突破


图像生成和代码工具 Codex 的发布,再次带来了“ChatGPT 时刻”般的惊喜。这些工具的成功不仅在于技术本身,更在于它们精准地满足了用户的预期,并催生了从娱乐到专业设计的广泛实用场景。OpenAI 正在探索一种“智能体”式的编程范式,让 AI 能够独立完成复杂的开发任务。

Andrew Mayn

我们聊聊另一个一夜爆火的发布——图像生成。DALL-E 3 和后续的图像生成功能(Image Gen)的出现,是一个让我措手不及的突破。你们有什么感觉?

Mark Chen

它也让我大吃一惊。这印证了一个论点:当你把一个模型做得足够好,好到它一次就能生成完全符合你要求的图片时,这就会创造巨大的价值。人们不想从一堆九宫格里挑最好的那个。它的提示词遵循能力和风格迁移能力都非常出色。

Nick Turley

这次图像生成的体验,就像是又经历了一次小型的 ChatGPT 时刻。发布后,全世界都为之疯狂。我记得那个周末,印度大概有 5% 的网民都试用了它。我们触及了从未想过的新用户群体。我原以为它只是个有趣的工具,但后来被它所有实用的用途给惊到了,比如规划家庭装修、为演示文稿创作插图等。

Andrew Mayn

另一个有趣的生成能力是代码。从 GPT-3 能吐出 React 组件,到专门训练的 Codex 和代码解释器,我们看到了巨大的潜力。在代码领域,竞争压力有多大?

Mark Chen

当人们谈论“编程”时,其实在谈论很多不同的事情。一种是在 IDE 里获得函数补全,另一种是“智能体风格” (agentic style) 的编程,即你直接要求它完成一个拉取请求(PR)。我们越来越看到,未来会更像这种异步模式,你给模型一个复杂的任务,让它在后台工作,一段时间后带着结果回来。我们首次发布的 Codex 就反映了这种范式。

Nick Turley

我经常用一个框架思考产品:当模型能力提升两倍时,产品的用处也要提升两倍。随着模型越来越聪明,人们可能更看重它在现实世界中实际能做什么。像 Codex 这样的体验创造了合适的载体,让我们可以把更聪明的模型放进去,这将是相当变革性的。它目前还是一个早期的研究预览版,但我们觉得尽早获得反馈是有益的。

04 AI 时代的生存法则:我们应具备何种技能?


面对 AI 带来的变革,最重要的不是学习具体的 AI 操作技巧,而是培养更根本的人类素质。OpenAI 在招聘时最看重的是好奇心、主观能动性和适应能力,这些品质将帮助人们在快速变化的世界中持续成长。

Andrew Mayn

现在有很多关于未来人们需要什么技能的讨论。你们在团队中寻找什么样的特质?对于 AI 领域之外的人,你们有什么建议?

Nick Turley

我最看重的品质是好奇心。在构建这项技术时,你必须保持谦逊,因为有太多的未知。在与 AI 合作时,瓶颈在于提出正确的问题,而不一定是得到答案。所以我从根本上相信,我们需要招聘那些对世界有深度好奇心的人,我反而不太在意他们在 AI 领域的经验。

Mark Chen

即使在研究团队,我们也越来越不那么看重 AI 博士学位。我认为对新员工来说,拥有“主观能动性”(agency)很重要。在 OpenAI,你不会得到详细的指令,而是需要有内在驱动力去发现和解决问题。另外就是“适应能力”,因为这个领域变化非常快。

Nick Turley

我们之所以能持续发布,就是因为我们有很多具备主观能动性、能够“发布”(ship)的人。这正是让 OpenAI 非常独特的地方。

Mark Chen

对于普通人,我的建议是,你必须真正地去拥抱和使用这项技术,看看自己的能力如何被增强。未来的演变方式是,AI 帮助最大的,是那些在某个领域能力还不够高的人。它是在“水涨船高”,让人们能够同时在很多事情上都变得称职和高效。

Nick Turley

感到敬畏甚至恐惧是很人性的,但真正去使用它是揭开其神秘面纱的最好方式。我认为像“提示词工程”并非正确的方向,更根本的人类技能,比如学习如何“授权”和“委托”,会变得极其重要。

未来,你的口袋里就会有一个智能体,它可以是你的家教,你的顾问,也可以是你的软件工程师。这更多的是关于你了解自己、了解问题,以及别人如何能帮助你,而不是对 AI 的具体理解。最重要的是,要准备好学习新事物。

05 展望未来:AI 的演进与应用


未来一到两年,AI 的“推理”能力将带来科学领域的加速发展。同时,AI 的交互形式将超越聊天,演变为能够执行异步、长期任务的智能体,解决从规划旅行到报税等更复杂的个人生活问题。这种范式转变为 AI 带来了全新的价值维度。

Andrew Mayn

你认为在未来一年到十八个月内,最让我们惊讶的会是什么?

Mark Chen

我认为是模型进行推理的能力。这个领域一个悄然兴起的变革,正是推动数学、科学和编码领域进步的动力。如今,许多顶尖物理学家的研究论文中,已经把 GPT-4 当作一个子程序来使用,自动化解决研究中的子问题。我们将看到物理学和数学等领域的进展出现加速。

Nick Turley

我认为你会看到一种不同形式的 AI 演变出来。聊天仍然是一种有用的交互模式,但你会越来越多地看到异步的工作流。消费者可能会派 AI 出去寻找一双完美的鞋子、规划一次旅行或完成报税。我们将以不同于仅仅是聊天机器人的方式来看待 AI。

Andrew Mayn

深度研究(Deep Research)功能就是一个很好的例子。它会花时间去循环查找和分析数据。这改变了我们的认知,即人们愿意为更好的答案而等待。这是否更新了你们对模型设计的思考方式?

Nick Turley

要打造一个超级助理,你必须放宽限制。现实世界中的智能体必须能够独立、主动地在很长一段时间内完成任务。能够执行五分钟、五小时甚至五天任务的能力,是一件非常根本的事情,它将在产品中解锁不同程度的价值。

Mark Chen

我们这样做是出于必要。模型需要时间来解决真正困难的问题,就像人需要时间思考脑筋急转弯一样。你的第一反应很可能是错的,需要时间去梳理。正是这种深度思考,最终才能造就强大的智能体。

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/184012
 
37 次点击