ChatGPT 一夜爆火的内幕：来自 OpenAI 核心团队的复盘与展望

核心要点

01
ChatGPT 的命名源于发布前深夜的临时决定，其一夜爆红的程度远超 OpenAI 内部所有人的预期，甚至一度引发系统崩溃。
02
OpenAI 的产品哲学从类似硬件的“完美发布”模式，转变为类似软件的“迭代部署”模式，强调快速获取真实世界反馈以驱动产品和安全体系的进化。
03
AI 的未来正朝着“智能体”范式演进，能够异步执行复杂任务，这将深刻改变编程、科学研究乃至个人生活的方方面面。
04
在 AI 时代，好奇心、主观能动性、适应能力以及学习如何“委托”任务给 AI，这些根本性的人类技能比“提示词工程”等具体技术更为重要。
05
AI 的价值在于“水涨船高”，它不仅能增强领域专家的能力，更能帮助普通人快速在多个领域达到称职水平，从而实现能力的普惠。

背景

本期播客邀请了 OpenAI 的两位核心人物：首席研究官 Mark Chen 和 ChatGPT 负责人 Nick Turley，由主持人 Andrew Mayn 与他们展开深度对话。他们共同回顾了 ChatGPT 从一个低调的研究预览版到全球现象级产品的戏剧性过程，首次揭秘了产品发布前后的内部挣扎、混乱与惊喜。对话深入探讨了 OpenAI 在产品开发、模型行为校准、人机协作以及未来技能培养等方面的核心理念与实践，为我们提供了一个来自 AI 革命中心的珍贵视角。

01 意外的诞生：ChatGPT 的命名与一夜爆红

ChatGPT 这个如今家喻户晓的名字，竟是在发布前深夜临时决定的。它的病毒式传播让整个团队始料未及，从最初怀疑后台数据出错，到最终意识到它将改变世界，这个过程充满了混乱与惊喜。

Andrew Mayn

第一个问题，OpenAI 是怎么想出 ChatGPT 这么个名字的？

Nick Turley

它原本的名字是“和 GPT 3.5 聊天”（Chat with GPT 3.5）。我们是在一个深夜，临时决定把它简化一下。我们意识到原来的名字太绕口了，所以最后换了个好名字。

Andrew Mayn

我记得当时我们内部都认为这只是一个低调的研究预览版，毕竟它基于已经发布了几个月的 3.5 模型，我们只是加了个聊天界面。然后它就发布了。你第一次感觉到这东西要火了，是什么时候？

Nick Turley

那段时间确实挺混乱的。对我来说，这个过程分了几个阶段：

第一天：后台数据是不是坏了？这日志记录肯定不对。
第二天：日本的 Reddit 用户发现了它，也许只是个别地区的现象。
第三天：它开始病毒式传播了，但热度肯定很快会过去。
第四天：你终于意识到，它要改变世界了。

Mark Chen

我完全没有预料到。我们过去发布过很多预览版，但这次真的不一样，增长曲线太陡峭了。而且，我爸妈也终于不再劝我跳槽去 Google 了，因为在这之前他们压根没听说过 OpenAI。

有趣的是，我们研究团队里，可能有一半人都不知道 GPT 这三个字母到底代表什么。一半人以为是“生成式预训练”（Generative Pre-training），另一半人以为是“生成式预训练 Transformer”（Generative Pre-trained Transformer），正确答案是后者。一个有点傻的名字，突然之间就成了一个符号，这事儿挺奇怪的。对我来说，当它出现在《南方公园》里时，我知道它真正引爆了流行文化。

Nick Turley

亲眼看着自己参与创造的东西进入流行文化，那种感觉太奇妙了。那集动画的结尾说，这集是和 ChatGPT 共同创作的，堪称点睛之笔。

02 从研究到产品：迭代部署与真实世界反馈

面对空前的用户需求，OpenAI 经历了从系统频繁宕机到逐步稳定的过程。这一经历促使团队反思并确立了新的产品哲学：从追求一次性完美发布的“硬件模式”转向快速迭代、拥抱反馈的“软件模式”。

Andrew Mayn

我记得产品发布几周后，在圣诞派对上，Sam Altman 还说热度很快就会过去。但事实恰恰相反。你们当时在内部做了些什么来维持产品运行？

Nick Turley

我们当时面临相当多的限制。一开始 ChatGPT 几乎天天宕机，GPU 不够用，数据库连接数爆了，供应商也开始对我们进行速率限制。整个系统根本不是为了一款正式产品准备的。我们甚至做了一个叫“故障鲸鱼”（Fail Whale）的页面，用一首 GPT-3 写的小诗客气地告诉用户网站挂了。

假期结束后，我们意识到这显然不是长久之计，于是才真正把它做成了一个能服务所有人的稳定系统。

Mark Chen

这种巨大的需求恰恰说明了 ChatGPT 的通用性。这体现了我们对 AGI 的设想，因为人们意识到，不管有什么样的应用场景，扔给这个模型，它都能处理。

但当时并非所有人都同意它足够好。就在发布前一晚，Ilya 亲自上阵，向模型提了十个刁钻的问题，结果可能只有五个答案让他满意。这说明当你在公司内部开发时，会很快对模型的能力习以为常，很难站在外部用户的角度去看到其中的魔力。

Nick Turley

当时内部关于“这东西是否足够好到可以发布”的争议，现在回想起来，挺让人感到谦卑的。因为它提醒我们，在人工智能这件事上，我们所有人都可能错得离谱，所以频繁地接触真实世界是多么重要。

我们在 ChatGPT 项目上有一个非常坚定的原则，就是不让项目范围过度膨胀，要尽快获得反馈和数据。我们发布时甚至没有历史记录功能。我很庆幸当时没有为了追求更完美的模型而推迟发布，因为我们通过发布获得了大量的反馈。

Mark Chen

用户反馈已经成为我们打造产品和安全体系不可或缺的一部分。你可以在真空中反复思量，但这完全无法替代把它直接推向市场。我们的理念是，让模型与世界接触，这种快速反馈是无可替代的。

Nick Turley

ChatGPT 的发布是一个开端，它让我们的工作模式变得更像做软件了。以前我们更像做硬件，发布周期长，每次都必须完美。现在我们可以频繁更新，如果有什么不好用就回滚。这样做降低了每次发布的风险，也让我们能更快地创新，更贴近用户的真实需求。

应对偏见与“谄媚”：模型行为的校准

Andrew Mayn

我们遇到过模型变得过于谄媚或奉承的问题，它会告诉我我是世界上最帅的人。你们如何权衡让用户满意和让模型更有用之间的关系？

Nick Turley

我们很幸运，因为我们的产品非常实用。人们用它来提高效率或完成他们本做不到的事。所以，使用时长绝对不是我们优化的目标，我们关心的是用户的长期留存率，因为那才是价值的真正体现。那个“谄媚”事件对我们是很好的教训，但从根本上说，我们有正确的激励机制去打造一个伟大的产品。

Andrew Mayn

另一个挑战是，ChatGPT 刚出来时被指责很“政治正确”（woke）。你们如何努力让模型保持中立，不试图引导用户？

Mark Chen

核心是一个衡量问题。我们需要确保模型的默认行为是中立的，不反映任何偏见。但同时，也要允许用户有能力去引导它，比如和持不同价值观的 AI 对话。关键在于默认设置要有意义且中立，同时给予用户一定的灵活性。

Nick Turley

除了中立的默认设置和用户自定义能力，保持透明也至关重要。我们努力公布我们的规范说明，让用户可以查阅模型的行为是 bug 还是符合规范。通过公布 AI 应该遵循的规则，我们就能让更多 OpenAI 之外的人参与到这场对话中来。

我们有一份庞大的文档，详细规定了模型在各种情况下的行为。例如，当用户带着错误的信念来时，模型不应直接驳斥，而应与用户合作，一起探寻真相。我们在这类非常微妙的决定上投入了大量思考。

03 超越文本：图像与代码生成的突破

图像生成和代码工具 Codex 的发布，再次带来了“ChatGPT 时刻”般的惊喜。这些工具的成功不仅在于技术本身，更在于它们精准地满足了用户的预期，并催生了从娱乐到专业设计的广泛实用场景。OpenAI 正在探索一种“智能体”式的编程范式，让 AI 能够独立完成复杂的开发任务。

Andrew Mayn

我们聊聊另一个一夜爆火的发布——图像生成。DALL-E 3 和后续的图像生成功能（Image Gen）的出现，是一个让我措手不及的突破。你们有什么感觉？

Mark Chen

它也让我大吃一惊。这印证了一个论点：当你把一个模型做得足够好，好到它一次就能生成完全符合你要求的图片时，这就会创造巨大的价值。人们不想从一堆九宫格里挑最好的那个。它的提示词遵循能力和风格迁移能力都非常出色。

Nick Turley

这次图像生成的体验，就像是又经历了一次小型的 ChatGPT 时刻。发布后，全世界都为之疯狂。我记得那个周末，印度大概有 5% 的网民都试用了它。我们触及了从未想过的新用户群体。我原以为它只是个有趣的工具，但后来被它所有实用的用途给惊到了，比如规划家庭装修、为演示文稿创作插图等。

Andrew Mayn

另一个有趣的生成能力是代码。从 GPT-3 能吐出 React 组件，到专门训练的 Codex 和代码解释器，我们看到了巨大的潜力。在代码领域，竞争压力有多大？

Mark Chen

当人们谈论“编程”时，其实在谈论很多不同的事情。一种是在 IDE 里获得函数补全，另一种是“智能体风格” (agentic style) 的编程，即你直接要求它完成一个拉取请求（PR）。我们越来越看到，未来会更像这种异步模式，你给模型一个复杂的任务，让它在后台工作，一段时间后带着结果回来。我们首次发布的 Codex 就反映了这种范式。

Nick Turley

我经常用一个框架思考产品：当模型能力提升两倍时，产品的用处也要提升两倍。随着模型越来越聪明，人们可能更看重它在现实世界中实际能做什么。像 Codex 这样的体验创造了合适的载体，让我们可以把更聪明的模型放进去，这将是相当变革性的。它目前还是一个早期的研究预览版，但我们觉得尽早获得反馈是有益的。

04 AI 时代的生存法则：我们应具备何种技能？

面对 AI 带来的变革，最重要的不是学习具体的 AI 操作技巧，而是培养更根本的人类素质。OpenAI 在招聘时最看重的是好奇心、主观能动性和适应能力，这些品质将帮助人们在快速变化的世界中持续成长。

Andrew Mayn

现在有很多关于未来人们需要什么技能的讨论。你们在团队中寻找什么样的特质？对于 AI 领域之外的人，你们有什么建议？

Nick Turley

我最看重的品质是好奇心。在构建这项技术时，你必须保持谦逊，因为有太多的未知。在与 AI 合作时，瓶颈在于提出正确的问题，而不一定是得到答案。所以我从根本上相信，我们需要招聘那些对世界有深度好奇心的人，我反而不太在意他们在 AI 领域的经验。

Mark Chen

即使在研究团队，我们也越来越不那么看重 AI 博士学位。我认为对新员工来说，拥有“主观能动性”（agency）很重要。在 OpenAI，你不会得到详细的指令，而是需要有内在驱动力去发现和解决问题。另外就是“适应能力”，因为这个领域变化非常快。

Nick Turley

我们之所以能持续发布，就是因为我们有很多具备主观能动性、能够“发布”（ship）的人。这正是让 OpenAI 非常独特的地方。

Mark Chen

对于普通人，我的建议是，你必须真正地去拥抱和使用这项技术，看看自己的能力如何被增强。未来的演变方式是，AI 帮助最大的，是那些在某个领域能力还不够高的人。它是在“水涨船高”，让人们能够同时在很多事情上都变得称职和高效。

Nick Turley

感到敬畏甚至恐惧是很人性的，但真正去使用它是揭开其神秘面纱的最好方式。我认为像“提示词工程”并非正确的方向，更根本的人类技能，比如学习如何“授权”和“委托”，会变得极其重要。

未来，你的口袋里就会有一个智能体，它可以是你的家教，你的顾问，也可以是你的软件工程师。这更多的是关于你了解自己、了解问题，以及别人如何能帮助你，而不是对 AI 的具体理解。最重要的是，要准备好学习新事物。

05 展望未来：AI 的演进与应用

未来一到两年，AI 的“推理”能力将带来科学领域的加速发展。同时，AI 的交互形式将超越聊天，演变为能够执行异步、长期任务的智能体，解决从规划旅行到报税等更复杂的个人生活问题。这种范式转变为 AI 带来了全新的价值维度。

Andrew Mayn

你认为在未来一年到十八个月内，最让我们惊讶的会是什么？

Mark Chen

我认为是模型进行推理的能力。这个领域一个悄然兴起的变革，正是推动数学、科学和编码领域进步的动力。如今，许多顶尖物理学家的研究论文中，已经把 GPT-4 当作一个子程序来使用，自动化解决研究中的子问题。我们将看到物理学和数学等领域的进展出现加速。

Nick Turley

我认为你会看到一种不同形式的 AI 演变出来。聊天仍然是一种有用的交互模式，但你会越来越多地看到异步的工作流。消费者可能会派 AI 出去寻找一双完美的鞋子、规划一次旅行或完成报税。我们将以不同于仅仅是聊天机器人的方式来看待 AI。

Andrew Mayn

深度研究（Deep Research）功能就是一个很好的例子。它会花时间去循环查找和分析数据。这改变了我们的认知，即人们愿意为更好的答案而等待。这是否更新了你们对模型设计的思考方式？

Nick Turley

要打造一个超级助理，你必须放宽限制。现实世界中的智能体必须能够独立、主动地在很长一段时间内完成任务。能够执行五分钟、五小时甚至五天任务的能力，是一件非常根本的事情，它将在产品中解锁不同程度的价值。

Mark Chen

我们这样做是出于必要。模型需要时间来解决真正困难的问题，就像人需要时间思考脑筋急转弯一样。你的第一反应很可能是错的，需要时间去梳理。正是这种深度思考，最终才能造就强大的智能体。