社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

ChatGPT 一夜爆火的内幕:来自 OpenAI 核心团队的复盘与展望

yikai 的摸鱼笔记 • 2 天前 • 15 次点击  

ChatGPT 一夜爆火的内幕:来自 OpenAI 核心团队的复盘与展望

核心要点

  • 01
    ChatGPT 的命名源于发布前深夜的临时决定,其一夜爆红的程度远超 OpenAI 内部所有人的预期,甚至一度引发系统崩溃。
  • 02
    OpenAI 的产品哲学从类似硬件的“完美发布”模式,转变为类似软件的“迭代部署”模式,强调快速获取真实世界反馈以驱动产品和安全体系的进化。
  • 03
    AI 的未来正朝着“智能体”范式演进,能够异步执行复杂任务,这将深刻改变编程、科学研究乃至个人生活的方方面面。
  • 04
    在 AI 时代,好奇心、主观能动性、适应能力以及学习如何“委托”任务给 AI,这些根本性的人类技能比“提示词工程”等具体技术更为重要。
  • 05
    AI 的价值在于“水涨船高”,它不仅能增强领域专家的能力,更能帮助普通人快速在多个领域达到称职水平,从而实现能力的普惠。

背景


本期播客邀请了 OpenAI 的两位核心人物:首席研究官 Mark Chen 和 ChatGPT 负责人 Nick Turley,由主持人 Andrew Mayn 与他们展开深度对话。他们共同回顾了 ChatGPT 从一个低调的研究预览版到全球现象级产品的戏剧性过程,首次揭秘了产品发布前后的内部挣扎、混乱与惊喜。对话深入探讨了 OpenAI 在产品开发、模型行为校准、人机协作以及未来技能培养等方面的核心理念与实践,为我们提供了一个来自 AI 革命中心的珍贵视角。

01 意外的诞生:ChatGPT 的命名与一夜爆红


ChatGPT 这个如今家喻户晓的名字,竟是在发布前深夜临时决定的。它的病毒式传播让整个团队始料未及,从最初怀疑后台数据出错,到最终意识到它将改变世界,这个过程充满了混乱与惊喜。

Andrew Mayn

第一个问题,OpenAI 是怎么想出 ChatGPT 这么个名字的?

Nick Turley

它原本的名字是“和 GPT 3.5 聊天”(Chat with GPT 3.5)。我们是在一个深夜,临时决定把它简化一下。我们意识到原来的名字太绕口了,所以最后换了个好名字。

Andrew Mayn

我记得当时我们内部都认为这只是一个低调的研究预览版,毕竟它基于已经发布了几个月的 3.5 模型,我们只是加了个聊天界面。然后它就发布了。你第一次感觉到这东西要火了,是什么时候?

Nick Turley

那段时间确实挺混乱的。对我来说,这个过程分了几个阶段:

  1. 第一天:后台数据是不是坏了?这日志记录肯定不对。
  2. 第二天:日本的 Reddit 用户发现了它,也许只是个别地区的现象。
  3. 第三天:它开始病毒式传播了,但热度肯定很快会过去。
  4. 第四天:你终于意识到,它要改变世界了。
Mark Chen

我完全没有预料到。我们过去发布过很多预览版,但这次真的不一样,增长曲线太陡峭了。而且,我爸妈也终于不再劝我跳槽去 Google 了,因为在这之前他们压根没听说过 OpenAI。

有趣的是,我们研究团队里,可能有一半人都不知道 GPT 这三个字母到底代表什么。一半人以为是“生成式预训练”(Generative Pre-training),另一半人以为是“生成式预训练 Transformer”(Generative Pre-trained Transformer),正确答案是后者。一个有点傻的名字,突然之间就成了一个符号,这事儿挺奇怪的。对我来说,当它出现在《南方公园》里时,我知道它真正引爆了流行文化。

Nick Turley

亲眼看着自己参与创造的东西进入流行文化,那种感觉太奇妙了。那集动画的结尾说,这集是和 ChatGPT 共同创作的,堪称点睛之笔。

02 从研究到产品:迭代部署与真实世界反馈


面对空前的用户需求,OpenAI 经历了从系统频繁宕机到逐步稳定的过程。这一经历促使团队反思并确立了新的产品哲学:从追求一次性完美发布的“硬件模式”转向快速迭代、拥抱反馈的“软件模式”。

Andrew Mayn

我记得产品发布几周后,在圣诞派对上,Sam Altman 还说热度很快就会过去。但事实恰恰相反。你们当时在内部做了些什么来维持产品运行?

Nick Turley

我们当时面临相当多的限制。一开始 ChatGPT 几乎天天宕机,GPU 不够用,数据库连接数爆了,供应商也开始对我们进行速率限制。整个系统根本不是为了一款正式产品准备的。我们甚至做了一个叫“故障鲸鱼”(Fail Whale)的页面,用一首 GPT-3 写的小诗客气地告诉用户网站挂了。

假期结束后,我们意识到这显然不是长久之计,于是才真正把它做成了一个能服务所有人的稳定系统。

Mark Chen

这种巨大的需求恰恰说明了 ChatGPT 的通用性。这体现了我们对 AGI 的设想,因为人们意识到,不管有什么样的应用场景,扔给这个模型,它都能处理。

但当时并非所有人都同意它足够好。就在发布前一晚,Ilya 亲自上阵,向模型提了十个刁钻的问题,结果可能只有五个答案让他满意。这说明当你在公司内部开发时,会很快对模型的能力习以为常,很难站在外部用户的角度去看到其中的魔力。

Nick Turley

当时内部关于“这东西是否足够好到可以发布”的争议,现在回想起来,挺让人感到谦卑的。因为它提醒我们,在人工智能这件事上,我们所有人都可能错得离谱,所以频繁地接触真实世界是多么重要。

我们在 ChatGPT 项目上有一个非常坚定的原则,就是不让项目范围过度膨胀,要尽快获得反馈和数据。我们发布时甚至没有历史记录功能。我很庆幸当时没有为了追求更完美的模型而推迟发布,因为我们通过发布获得了大量的反馈。

Mark Chen

用户反馈已经成为我们打造产品和安全体系不可或缺的一部分。你可以在真空中反复思量,但这完全无法替代把它直接推向市场。我们的理念是,让模型与世界接触,这种快速反馈是无可替代的。

Nick Turley

ChatGPT 的发布是一个开端,它让我们的工作模式变得更像做软件了。以前我们更像做硬件,发布周期长,每次都必须完美。现在我们可以频繁更新,如果有什么不好用就回滚。这样做降低了每次发布的风险,也让我们能更快地创新,更贴近用户的真实需求。

应对偏见与“谄媚”:模型行为的校准


Andrew Mayn

我们遇到过模型变得过于谄媚或奉承的问题,它会告诉我我是世界上最帅的人。你们如何权衡让用户满意和让模型更有用之间的关系?

Nick Turley

我们很幸运,因为我们的产品非常实用。人们用它来提高效率或完成他们本做不到的事。所以,使用时长绝对不是我们优化的目标,我们关心的是用户的长期留存率,因为那才是价值的真正体现。那个“谄媚”事件对我们是很好的教训,但从根本上说,我们有正确的激励机制去打造一个伟大的产品。

Andrew Mayn

另一个挑战是,ChatGPT 刚出来时被指责很“政治正确”(woke)。你们如何努力让模型保持中立,不试图引导用户?

Mark Chen

核心是一个衡量问题。我们需要确保模型的默认行为是中立的,不反映任何偏见。但同时,也要允许用户有能力去引导它,比如和持不同价值观的 AI 对话。关键在于默认设置要有意义且中立,同时给予用户一定的灵活性。

Nick Turley

除了中立的默认设置和用户自定义能力,保持透明也至关重要。我们努力公布我们的规范说明,让用户可以查阅模型的行为是 bug 还是符合规范。通过公布 AI 应该遵循的规则,我们就能让更多 OpenAI 之外的人参与到这场对话中来。

我们有一份庞大的文档,详细规定了模型在各种情况下的行为。例如,当用户带着错误的信念来时,模型不应直接驳斥,而应与用户合作,一起探寻真相。我们在这类非常微妙的决定上投入了大量思考。

03 超越文本:图像与代码生成的突破


图像生成和代码工具 Codex 的发布,再次带来了“ChatGPT 时刻”般的惊喜。这些工具的成功不仅在于技术本身,更在于它们精准地满足了用户的预期,并催生了从娱乐到专业设计的广泛实用场景。OpenAI 正在探索一种“智能体”式的编程范式,让 AI 能够独立完成复杂的开发任务。

Andrew Mayn

我们聊聊另一个一夜爆火的发布——图像生成。DALL-E 3 和后续的图像生成功能(Image Gen)的出现,是一个让我措手不及的突破。你们有什么感觉?

Mark Chen

它也让我大吃一惊。这印证了一个论点:当你把一个模型做得足够好,好到它一次就能生成完全符合你要求的图片时,这就会创造巨大的价值。人们不想从一堆九宫格里挑最好的那个。它的提示词遵循能力和风格迁移能力都非常出色。

Nick Turley

这次图像生成的体验,就像是又经历了一次小型的 ChatGPT 时刻。发布后,全世界都为之疯狂。我记得那个周末,印度大概有 5% 的网民都试用了它。我们触及了从未想过的新用户群体。我原以为它只是个有趣的工具,但后来被它所有实用的用途给惊到了,比如规划家庭装修、为演示文稿创作插图等。

Andrew Mayn

另一个有趣的生成能力是代码。从 GPT-3 能吐出 React 组件,到专门训练的 Codex 和代码解释器,我们看到了巨大的潜力。在代码领域,竞争压力有多大?

Mark Chen

当人们谈论“编程”时,其实在谈论很多不同的事情。一种是在 IDE 里获得函数补全,另一种是“智能体风格” (agentic style) 的编程,即你直接要求它完成一个拉取请求(PR)。我们越来越看到,未来会更像这种异步模式,你给模型一个复杂的任务,让它在后台工作,一段时间后带着结果回来。我们首次发布的 Codex 就反映了这种范式。

Nick Turley

我经常用一个框架思考产品:当模型能力提升两倍时,产品的用处也要提升两倍。随着模型越来越聪明,人们可能更看重它在现实世界中实际能做什么。像 Codex 这样的体验创造了合适的载体,让我们可以把更聪明的模型放进去,这将是相当变革性的。它目前还是一个早期的研究预览版,但我们觉得尽早获得反馈是有益的。

04 AI 时代的生存法则:我们应具备何种技能?


面对 AI 带来的变革,最重要的不是学习具体的 AI 操作技巧,而是培养更根本的人类素质。OpenAI 在招聘时最看重的是好奇心、主观能动性和适应能力,这些品质将帮助人们在快速变化的世界中持续成长。

Andrew Mayn

现在有很多关于未来人们需要什么技能的讨论。你们在团队中寻找什么样的特质?对于 AI 领域之外的人,你们有什么建议?

Nick Turley

我最看重的品质是好奇心。在构建这项技术时,你必须保持谦逊,因为有太多的未知。在与 AI 合作时,瓶颈在于提出正确的问题,而不一定是得到答案。所以我从根本上相信,我们需要招聘那些对世界有深度好奇心的人,我反而不太在意他们在 AI 领域的经验。

Mark Chen

即使在研究团队,我们也越来越不那么看重 AI 博士学位。我认为对新员工来说,拥有“主观能动性”(agency)很重要。在 OpenAI,你不会得到详细的指令,而是需要有内在驱动力去发现和解决问题。另外就是“适应能力”,因为这个领域变化非常快。

Nick Turley

我们之所以能持续发布,就是因为我们有很多具备主观能动性、能够“发布”(ship)的人。这正是让 OpenAI 非常独特的地方。

Mark Chen

对于普通人,我的建议是,你必须真正地去拥抱和使用这项技术,看看自己的能力如何被增强。未来的演变方式是,AI 帮助最大的,是那些在某个领域能力还不够高的人。它是在“水涨船高”,让人们能够同时在很多事情上都变得称职和高效。

Nick Turley

感到敬畏甚至恐惧是很人性的,但真正去使用它是揭开其神秘面纱的最好方式。我认为像“提示词工程”并非正确的方向,更根本的人类技能,比如学习如何“授权”和“委托”,会变得极其重要。

未来,你的口袋里就会有一个智能体,它可以是你的家教,你的顾问,也可以是你的软件工程师。这更多的是关于你了解自己、了解问题,以及别人如何能帮助你,而不是对 AI 的具体理解。最重要的是,要准备好学习新事物。

05 展望未来:AI 的演进与应用


未来一到两年,AI 的“推理”能力将带来科学领域的加速发展。同时,AI 的交互形式将超越聊天,演变为能够执行异步、长期任务的智能体,解决从规划旅行到报税等更复杂的个人生活问题。这种范式转变为 AI 带来了全新的价值维度。

Andrew Mayn

你认为在未来一年到十八个月内,最让我们惊讶的会是什么?

Mark Chen

我认为是模型进行推理的能力。这个领域一个悄然兴起的变革,正是推动数学、科学和编码领域进步的动力。如今,许多顶尖物理学家的研究论文中,已经把 GPT-4 当作一个子程序来使用,自动化解决研究中的子问题。我们将看到物理学和数学等领域的进展出现加速。

Nick Turley

我认为你会看到一种不同形式的 AI 演变出来。聊天仍然是一种有用的交互模式,但你会越来越多地看到异步的工作流。消费者可能会派 AI 出去寻找一双完美的鞋子、规划一次旅行或完成报税。我们将以不同于仅仅是聊天机器人的方式来看待 AI。

Andrew Mayn

深度研究(Deep Research)功能就是一个很好的例子。它会花时间去循环查找和分析数据。这改变了我们的认知,即人们愿意为更好的答案而等待。这是否更新了你们对模型设计的思考方式?

Nick Turley

要打造一个超级助理,你必须放宽限制。现实世界中的智能体必须能够独立、主动地在很长一段时间内完成任务。能够执行五分钟、五小时甚至五天任务的能力,是一件非常根本的事情,它将在产品中解锁不同程度的价值。

Mark Chen

我们这样做是出于必要。模型需要时间来解决真正困难的问题,就像人需要时间思考脑筋急转弯一样。你的第一反应很可能是错的,需要时间去梳理。正是这种深度思考,最终才能造就强大的智能体。

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/184012
 
15 次点击