社区
教程
Wiki
注册
登录
创作新主题
社区所有版块导航
Python
python开源
Django
Python
DjangoApp
pycharm
DATA
docker
Elasticsearch
分享
问与答
闲聊
招聘
翻译
创业
分享发现
分享创造
求职
区块链
支付之战
aigc
aigc
chatgpt
WEB开发
linux
MongoDB
Redis
DATABASE
NGINX
其他Web框架
web工具
zookeeper
tornado
NoSql
Bootstrap
js
peewee
Git
bottle
IE
MQ
Jquery
机器学习
机器学习算法
Python88.com
反馈
公告
社区推广
产品
短视频
印度
印度
一周十大热门主题
【官方玩梗:Python 3.14(πthon)稳定版发布,正式-20251008000400
斯坦福CS230深度学习课程上新了,新增GPT-5专题!
Python+R+Matlab+Stata,机器学习+异质稳健估计量等--《中国工业经济》25年第9...
三分钟搞定!国内用支付宝/微信完成ChatGPT Plus 续费充值
国庆哪都没去,宅家做Python私活,赚了5w...
OpenAI生态浮现! 2025开发者日大会干货满满:ChatGPT要变成操作系统,每周用户达8亿....
浙江大学AFM:集成高通量合成、焦耳热测试与机器学习的高熵氧化物催化剂快速开发
这款录屏神器在 GitHub 火了,吊打众多付费工具!
【2025年5月Python占比24.45%蝉联榜首】TIOBE-20251010173000
2025 年 10 月编程语言排行榜|C、C++、Java 第二名之争愈演愈烈,Python 继续称...
关注
Py学习
»
chatgpt
奥特曼回应一切:ChatGPT不是美国版微信,Sora是为假视频时代「打预防针」|附万字采访
AppSo
• 2 天前 • 13 次点击
我们已经可以认真讨论「零人公司」这件事了。
2025 年 DevDay 现场,OpenAI CEO Sam Altman 在接受博主 Rowan Cheung 的采访时抛出了这个观点。语气轻松,但分量不轻。
数据支撑着他的底气:ChatGPT 用户周活跃用户突破 8 亿,周活跃开发者突破 400 万,最近发布的 AgentKit 让普通人几分钟就能搭建复杂 Agent,AI 也开始在数学和科学领域做出「小小的发现」。
这些成就背后藏着一个更深的问题:当 AI 能完成越来越多的工作,「工作」本身还意味着什么?在 Altman 看来,50 年前的农民无法想象坐在办公桌前敲键盘也能叫工作, 就像我们现在也无法想象未来人类会把时间花在哪些事情上。
不同的是,这次转变的速度可能快到让人措手不及。
整场访谈中,Altman 展现出一种难得的坦诚。他承认 OpenAI 在某些测试上输给了竞争对手, 承认提前发布 Sora 是为了让社会接受假视频的冲击, 承认「AI slop」(AI 垃圾) 确实是个问题——但话锋一转,他补充道:人类自己也一直在制造烂活儿。
采访最后,Altman 耐人寻味地表示,他很羡慕现在 20 岁的创业者,因为有了 AI,机会空间「实在太广了」。
附相关阅读 🔗:
刚刚,OpenAI 宣布打造 「ChatGPT 操作系统」,8 亿用户将迎来全新体验
采访省流版:
关于产品发布和未来方向
核心重点是智能体(Agent):他个人对 Agent 的方向最感兴趣,并认为将 Apps 与 ChatGPT 结合会非常强大。
Agent Builder 是革命性的:他认为从 GPT Builder 到 Agent Builder 的最大飞跃是模型本身能力的巨大提升。现在的 Agent Builder 实现了「无代码革命」,让普通知识工作者也能轻松构建复杂的智能体系统,
这是软件开发领域地震式的变化。
语音交互潜力巨大:他不认为语音是唯一的最终交互方式,但在许多场景下是一种非常自然、被低估的交互方式。
当前智能音箱体验不佳是因其背后的 AI 不够强大,而非语音交互本身的问题。
关于 AI 的发展和影响
开发速度将极大提升:AI 工具将使软件开发周期一降再降,让创业者可以极快地测试和迭代想法。
自主智能体即将到来:他认为,像 Code Interpreter 这样能独立完成「一周工作量」的智能体,可能很快就能实现,并非遥不可及的目标。
技术突破的关键在于更聪明的模型、更长的上下文处理能力和更好的记忆系统。
AGI 的核心是发现新知识:对他而言,AGI 最重要的衡量标准已不是通过某个测试,而是 AI 开始具备「发现新知识」并扩展人类知识边界的能力。他对此感到非常乐观。
社会将快速适应 AI:他以「图灵测试」被超越后社会迅速适应为例,认为人类也会很快习惯 AI 做出科学发现,以及适应由 AI 生成的、真假难辨的视频内容。
关于创业和商业模式
创业者的独特优势是在实践中发现的:
他建议创业者从「有用、能跑得通」的事情做起,在过程中逐步发现并形成自己的长期优势(护城河
),就像 ChatGPT 的「记忆」功能一样,是事后才发现其巨大价值的。
OpenAI 不想做「超级应用」:
他们的目标是构建一个强大的「AI 超级系统」,而不是像微信那样的「超级 App」。
因此,功能(如 Sora 视频生成)可能会作为独立应用存在,以适应不同的用户场景和心态。
Sora 等新产品的商业模式仍在探索中:他提到,可能会尝试让用户付费生成视频,并与授权肖像的名人进行「收入分成」,
但最终的商业模式(按次计费、订阅或广告)将取决于产品的演化和用户的主流使用方式。
关于社会和未来
「AI 制造垃圾工作」是伪命题:他认为低效工作(slop)是人类固有的问题,而非 AI 独有。经济体系会自我纠正,最终奖励那些高效使用工具的人。
未来工作的形态会彻底改变:
以「农民」作类比,他认为未来由 AI 创造的新工作在我们看来可能「不像真正的工作」,
但人类依然会找到新的目标和意义。他担忧的是转型的短期阵痛。
需要全球性的 AI 安全框架:他认为,随着模型越来越强大,世界需要一个全球性的框架来降低潜在的灾难性风险,这个框架应从一个完善的「测试机制」入手。
附上
Rowan Cheung 采访
视频地址:
https://www.youtube.com/watch?v=zwnVUiwObl8
另外,今天凌晨,Sam Altman 接受 a16z 的访谈视频也正式公开,我们也整理了其中几个值得关注的观点。
OpenAI 的核心愿景:
最终目标是构建通用人工智能(AGI)并使其对人类有益。
实现这一目标的主要方式是为用户提供「个人 AI 订阅服务」,这个 AI 将深度了解用户,并在各种设备和服务中提供帮助。
产品与 AGI 的关系(共同进化理论):
像 ChatGPT 和 Sora 这样的产品,不仅是消费级应用,更是实现 AGI 的关键步骤。
它们不仅能推动核心研究(如 Sora 帮助构建「世界模型」),更重要的是能让社会与技术「共同进化」,帮助公众逐步理解和适应即将到来的技术变革,避免技术成熟后突然冲击社会。
对未来的关键预测(AI 科学家):
Sam Altman 个人最兴奋的未来方向是「AI 科学家」。他认为,衡量 AI 的真正标准不是图灵测试,而是当 AI 能独立进行科学研究并做出新发现时。
他预测,在两年内,AI 模型将能够承担更大规模的科研任务,并做出重要的科学发现,这将是推动人类社会进步的巨大变革。
商业与战略:
激进地投资基础设施:由于对未来的研究路线图和模型经济价值极度自信,OpenAI 正在进行大规模的基础设施投资,并与整个行业的众多公司(如 AMD、Oracle、NVIDIA)展开广泛合作。
对广告模式持谨慎开放态度:
他认为广告
并非完全不可行,但用户信任是绝不能破坏的底线。任何为商业利益而牺牲推荐质量的广告模式(如付费推荐产品)都是不可接受的,因为这会摧毁用户与 ChatGPT 建立的信任关系。
支持开源:他认为开源是件好事,并对自家开源模型的受欢迎程度感到高兴。提供高质量的开源模型也是一种重要的战略,可以为全球开发者和学术界提供可靠的选择。
关于版权和数据训练的看法:
他大胆预测,社会最终会认定,用于模型训练的数据属于「合理使用(fair use)」。
但他认为,直接用 AI 生成受版权保护的内容,则会出现新的规则和商业模式。
他观察到一个新趋势:许多版权方已经从担忧「AI 用了我的角色」转变为担忧「AI 用我的角色用得不够多」,他们希望在保证角色形象不受损害的前提下,通过 AI 互动来提升 IP 价值和粉丝粘性。
附上 a16z 采访视频地址
https://www.youtube.com/watch?v=JfE1Wun9xkk
Rowan Cheung:现在是 2025 DevDay,你能不能总结一下今天公布了哪些内容?你个人又对哪部分最感兴趣?
Sam Altman:我对所有内容都很兴奋。嗯,我很关注 ChatGPT,这其实是我一直想做的事情——和人们聊聊他们在用它做什么。
智能体(agent)这个问题也让我很感兴趣,很多关于 agent 的内容我真的很想亲自用用。但如果非要说一个重点,
我觉得 Apps 和 ChatGPT 的结合会非常棒。
我很喜欢 Agent 这个方向。
Rowan Cheung:如果让我作为一个开发者去尝试一些酷炫的东西,那我可能会从那里开始。另外我们现在有八亿用户了,恭喜啊,这真的很了不起。显然,ChatGPT 已经成为下一个重要的分发平台。
现在开发者可以通过 Apps SDK 构建基于 ChatGPT 的应用,我觉得这是一个巨大的机会。
Sam Altman:我觉得我们还需要一些迭代,来摸索出人们真正想怎么用这些东西。比如:用户到底更倾向于通过调用某个应用来完成任务,还是希望 ChatGPT 本身就知道他们想干什么并主动推荐?
我认为,开发者最终会找到一种新的分发机制,非常适合他们。
但说到底,这些产品推向世界后,总是会带来一些意想不到的惊喜。
Rowan Cheung:我记得你们也发布了一些文档,教大家怎么更好地被推荐,是吗?
Sam Altman:是的,不过也要加一句常规提醒:这是全新的产品,变化很快,我们会边走边学。但没错,这些文档我们今天就会发布。
几分钟部署智能体,软件开发真的在「地震」
Rowan Cheung:我很想读一读那些文档。嗯,我们来聊聊 Agent Builder(智能体构建器)吧,回到第一次 DevDay 的话题。
两年前,你们发布了 GPT Builder,那真的很棒。我记得我好像是最早构建公开 GPT 的人之一。那么,从那时候到现在,你们做了哪些重大改进,才有了今天的 Agent Builder?
Sam Altman:最主要的变化就是模型本身变得更强大了。我们等下会谈到很多方面,但我回头想想那次首次 Dev Day,模型能力的差距真的非常大。虽然也就二十几个月,但我们已经走了很长一段路。
除此之外,我们还学到了很多用户想如何构建这种智能体工具。他们也希望能把这些智能体部署到 ChatGPT 之外的其他平台上。
我觉得最惊喜的是,现在构建一个复杂系统变得非常简单。比如你现在可以直接用一个可视化工具,把几个文件上传,配置一些数据源,告诉它你要实现什么目标,然后就可以部署了。整个流程只需要几分钟。
昨天我们还在内部演示,我第一次完整看了一遍整个流程。像 Code Interpreter(代码解释器)、Agent 工具包这些东西,加上整个构建体验,
让我觉得软件开发经历了一场地震式的变化。
我自己都还没完全弄明白这会带来多大的影响。
Rowan Cheung:如果我理解没错的话,在 Agent Builder 里,基本上可以零代码构建智能体对吧?
Sam Altman:对,完全可以。
Rowan Cheung:当然,懂点编程会更有帮助,能做更复杂的功能,但普通的知识工作者也可以上手构建。
Sam Altman:
没错,人人都可以构建智能体。
Rowan Cheung:这听起来几乎就像是一次「无代码革命」,只是这次是针对智能体的。
Sam Altman:完全同意。就像你说的,懂一点或很多代码确实能做出更强大的东西,但最重要的是,现在的入门门槛已经非常低了,几乎人人都能开始尝试。
Rowan Cheung:你觉得这些变化会对下一波创业者或者开发者产生什么影响?
Sam Altman:这正是我最近一直在努力思考的事情。我在后台看演示时就在想——
这些东西在一年前做起来要花费很长时间。而现在,你几乎可以实时做出来。说真的,我现在已经快跟不上点子生成的速度了。
我还不确定这会如何演变,但很明显,全世界将会有越来越多的软件被写出来。测试和迭代的速度会不断加快,开发周期会一降再降。
只是……我现在真的很难完全想明白这意味着什么。我觉得最明显的变化是:一切都会发生得更快,你可以快速尝试很多想法,更快地找到更好的方向。但除此之外,还会带来什么变化,我也说不好。
「一人公司」离我们只差几个 prompt
Rowan Cheung:我听说你和朋友之间还有一个打赌——猜测第一个靠 AI 智能体赚到十亿美元的公司会什么时候出现。你觉得 Agent Builder 会让这个目标更接近吗?
Sam Altman:可能还没到那个时候。嗯,之前我们打赌的点是:
第一个「一个人公司」靠 AI 赚到十亿美元会何时诞生。
虽然我们没正式立个规则,但大家一直在猜什么时候会出现第一个这种公司。
Rowan Cheung:那「零人公司」呢?是几个月,还是几年?
Sam Altman:
我猜,可能还需要几年。但关键是——我们现在已经可以认真地去讨论这样的一天了。你可以直接在 ChatGPT 里写个提示词,然后它就能帮你搞定一切。
Rowan Cheung:这已经非常疯狂了,我完全同意。不过 2025 年原本被很多人认为是「智能体元年」。我们确实看到了一些还不错的智能体产品,但它们仍然需要大量人工监督和反馈。你觉得什么时候我们才能拥有那种一整周都不需要人干预的智能体?
Sam Altman:我觉得,像 Code Interpreter(代码解释器)这样的工具,距离完成「一周的工作量」其实已经不远了。虽然听起来有点疯狂,但我觉得这并不是一个遥不可及的 2025 年目标。
今天我还和一些人聊起这事,他们也很惊讶地说:「它现在真的已经能完成一天的任务了?怎么发展得这么快?」老实说,我通常不会觉得 AI 的进步有多夸张,但在 ChatGPT Code Interpreter 能完成的任务长度这个方面,我真的感受到一种爆炸式的进展。所以我猜,一周级别的任务,可能真的很快就能实现。
Rowan Cheung:那要实现这种 Agent,还需要哪些技术上的突破?
Sam Altman:
更聪明的模型、更长的上下文处理能力、更好的记忆系统。
Rowan Cheung:好的。你们现在有了 AgentKit、持续升级的模型、Codex,还有 API。看起来现在真的能构建太多东西了。那如果你回到过去,把一个刚从斯坦福退学的 20 岁年轻人带到现在,并让他拥有我们今天所有的工具,你觉得他该做什么,不该做什么?
Sam Altman:我前几天其实还真在想这个问题。
老实说,我挺羡慕现在这代 20 岁的创业者们的,因为他们能做的事情太多了,机会空间实在太广了。
过去几年里,我一直没腾出真正完整的时间去深入想「我要做什么」,但我知道现在有非常多值得构建的好产品。今天和现场很多人聊天,也被他们正在做的项目震撼到了。真的很棒。
Rowan Cheung:我自己也是从零开始,我觉得现场很多开发者可能也是这种状态。现在能做的东西太多了,你有没有什么建议?比如说,在构建产品时,应该寻找怎样的「独特优势」?是分发方式?数据?还是某种工作流模型?
Sam Altman:这个问题抽象地讲我一直觉得挺难回答的。因为我认为最好的「独特优势」,往往是你自己为你要做的事情量身打造的。我们在 OpenAI 也花了很多精力去找到这一点。我觉得这没有通用的「最佳答案」。
最好的回答应该是:你找到了一些,只对你当前产品、技术、市场定位在这个时间点上才成立的独特东西。而这类东西,往往就构成了你能创造巨大价值的核心。
不过,有一点通用的建议我可以说:你是在做的过程中逐步发现优势的。我很喜欢一句经典的商业名言——「让战术变成战略。」
你可以先从一些「有用、能跑得通的事情」开始,往往在这个过程中,就会慢慢浮现出某些可以上升为战略的东西。
如果你在我们刚开始做 ChatGPT 的时候问我:「你们未来会有什么持久的优势?」我可能会说「我也不知道」,或者给你一堆猜测,但不会有特别自信的答案。
但现在回头看,像「记忆」功能,其实就成为了一个非常强的竞争优势,也是用户持续使用 ChatGPT 的重要原因之一——可当时我们压根没想到这点。
所以你在构建功能时,有时会意外地发现:「哇,这个点其实可以成为我们长期的护城河。」这就是你一边走、一边找、慢慢形成的过程。
Rowan Cheung:有没有什么迹象能告诉我们,现在在构建产品时应该朝着哪种「长期优势」去努力?比如说该怎么为 GPT-6 时代布局?或者说,现在到底该怎么思考产品构建这件事?
Sam Altman:这个嘛,最终还是得你自己去摸索出来。当然如果有时间我很乐意参与头脑风暴,这事儿本身就挺有趣的。
但说实话,OpenAI 现在几乎占据了我全部的脑力空间,我已经没有什么机会去认真思考怎么创业了,这点其实还挺遗憾的。
我觉得 AI 虽然改变了世界上很多事情,但它并没有改变一个公司获得优势的底层机制。
比如说,网络效应、品牌和市场优势、用户数据、平台或市场的双边效应等等,这些因素过去行得通,现在依然有效。如果你去列一个近几年成功企业的清单,那些驱动力大概率现在也还适用。只不过,现在可能会有一些新的策略、新的打法罢了。
Rowan Cheung:最近发布了一个叫 GDPval 的基准测试,用来衡量模型在现实经济中、尤其是典型知识工作岗位上执行任务的能力。让我有点意外的是,GPT-4.5 的表现排在第二,第一名是一个封闭服务模型。你们还没发布 GPT-5,但你对这个结果感到惊讶吗?
Sam Altman:一点也不惊讶。首先,如果我们只能在排名第一的时候才发布产品,那就太糟糕了。我们不可能在所有事情上都做到最好,这很正常。
想要长期变得更好,文化里必须包含一个元素:坦然承认在某些基准测试上别人更强。
有时候别人就是做得比你好。说实话,那家公司确实在理解企业级使用场景上做得很出色,而且输出格式也非常漂亮。我并不惊讶,反而觉得这激励我们继续提升。
Rowan Cheung:这个基准测试有没有影响你们在构建 GPT-6 时的方向?
Sam Altman:它会影响我们后续训练(post-training)的一些方式,但整体上我们对 GPT-6 的核心策略是不会改变的。
Rowan Cheung:你之前说过,你对 AGI(通用人工智能)的定义是:当它在大多数具有经济价值的任务上超过人类。那么,如果某个模型在 GDP-V 的得分达到某个程度,你会认为 AGI 实现了吗?
Sam Altman:我最近也在认真思考这个问题。
首先,像很多人一样,我对 AGI 也有多个定义。离目标越近,这个概念反而越模糊。
但对我来说,最重要、也是让我最惊喜的一点是:我们已经开始看到 AI 具备「发现新知识」的能力了。也就是说,AI 可以扩展人类目前的知识边界。虽然现在这些例子还很小,但这才是我最在意的突破。
我真的不想把这件事说得太夸张,但你现在可以在 X 上看到很多例子,科学家们在各个领域都在说:「AI 做出了一个小小的发现」、「它提出了一种全新的方法」、「它解决了某个我们一直没解开的难题」。而这些背后的原理,我们可能也还没完全理解。
就是这种感觉。现在还只是刚刚开始而已,而我们对未来几个月、几年能在这个方向上持续推进感到非常乐观。这件事意义非常重大。它可能是我最关心的、最接近 AGI(通用人工智能)的那部分能力。
APPSO 注释:在 a16z 的采访视频中,根据 Sam Altman 的观点,OpenAI 的整体愿景和核心使命非常简单,那就是打造通用人工智能(AGI)并让它真正为人类服务。实现这一宏大目标的主要方式,是为每个人提供一种「个人 AI 订阅服务」。这个个人 AI 将随着时间推移深度了解用户,变得越来越有帮助,并且用户可以在 OpenAI 自家的产品、登录其他第三方服务,甚至在专属硬件设备上随时使用它。为了支撑这一切,公司必须构建庞大的基础设施,这些设施目前主要服务于这个核心目标和相关的研究。
他强调,如此大规模的基础设施投入远超单个公司的能力,需要获得行业大部分力量的支持与协作。因此,OpenAI 将与众多公司展开广泛合作,合作范围覆盖从底层的电力、电子供应到上层的模型分发系统等所有环节,并且可以预期在未来几个月里会宣布更多新的合作关系。
Rowan Cheung:有没有哪个具体的科学突破,是你特别兴奋、特别希望 AI 能帮我们实现或解开的?
Sam Altman:当然了,比如说治愈某些疾病,或者发现全新的物理规律,这些都是非常令人兴奋的方向。即使是现在正在发生的一些「小事」,也同样令人振奋。
比如在数学领域的一些进展,也给人一种特别振奋的感觉——就像 GPT-4 刚发布时带来的那种冲击感。
我知道大家对「图灵测试」到底是什么意思还存在很多争议,但从大众的角度来看,图灵测试曾经是一个看起来遥不可及的目标。然后,突然之间,它被「通过了」。可整个社会几乎没有什么反应。
人们可能讨论了两周,然后就开始说:「这玩意儿怎么还这么慢?」、「能不能再做得更好点?」我觉得这其实也说明了人类的伟大——我们非常善于适应。曾经被视为衡量 AI 智能的终极测试,突然之间就被超越了,而我们也很快就习惯了。
我现在有种类似的感觉:我们也会很快习惯 AI 做出科学发现这件事。
Rowan Cheung:感觉有点像电影《Her》里人类适应 AI 的情节。
Sam Altman:是的,只有第一次觉得奇怪。
Rowan Cheung:没错,奇怪也就那三分钟,之后你就习惯了。嗯,我确实感受到了这种趋势。最近有一个新术语叫做「slop」,意思是那些看起来很精致、但其实很低效的工作成果。它们通常需要反复返工才能真正有用。
一项针对上千名测试用户的调查显示,有 41% 的人表示他们在过去一个月里,曾从同事那里遇到过这种「slop」工作流。每次「清理烂摊子」平均花费 1 小时 6 分钟,每名员工每月因此造成的损失大约是 100 美元。
那么,如果 AI 能够让部分人(比如在这个活动现场的很多人)效率提升 10 倍,我们该如何进行教育?如何帮助老师和普通人理解:什么时候该用 AI,什么时候不该用?
Sam Altman:首先,要说的是,
人类自己其实也常常制造「slop」工作流,所以这并不是 AI 独有的问题。比如那种「写邮件只是为了制造更多工作」的人,你懂我意思吧。
就像会议也是一样,明明是为了协作,结果反而变成拖累。所以「slop」不是新现象,它在 AI 出现之前就已经存在了。过去就有一类人会用工具提高效率,也有另一类人只是在制造混乱和负担。
我觉得我们也没必要对 AI 抱有不切实际的期待。经济体系是自我纠正的——那些真正用工具提高效率的人和公司,最终会获得更多影响未来的能力;而那些用 AI 拖累组织的人,会自然被边缘化。
像所有新工具一样,AI 的使用也有学习曲线,但我相信这个学习过程会相对快速。
Rowan Cheung:那 OpenAI 有没有做什么事情来帮助大家在教育和入门阶段更好地掌握这种「使用直觉」?
Sam Altman:有的,我们确实在做这方面的工作。人们使用工具的方式就是他们自己的方式。有一件事我学到了,那就是:哪怕你提供了再好的教学内容、培训资源,最后人们还是会发现他们可以用它来——比如说,让 ChatGPT 模仿海盗说话,然后他们就真的去这么做了(笑)。
但我们确实在努力创建很多内容,帮助人们在真实工作场景中高效使用 AI。比如在 Codex 的推广过程中,很多公司采用它的速度非常快,甚至在几天或几周内就完成了工作流程整合,效果非常好。
Rowan Cheung:回到 「slop」 这个话题,其实这是世界上第一个「以 AI 为中心」的工作年。
Sam Altman:是的,可以说是整个互联网都在经历这个转变。
Rowan Cheung:你会不会觉得,这种变化也像你之前提到的——目标设得太高,比如 GPU 的使用、算力的投入,等等?
Sam Altman:其实这是我原本以为会很奇怪的事情,但结果出人意料地没那么怪。甚至有点反常识——你翻看上百个例子,反而比你只看一个还要自然一些。
我当时一边看,一边还在想这个问题。对了,我还刚完成了一次环球旅行……
在产品上线前,团队里有个人发消息问我:「我们能不能把你的那个骆驼形象开放访问?」那一刻我几乎没想太多,8 秒内就回复了同意。但后来想想,其实这事儿也许值得更认真考虑一下。只是当时我心里也想——这是一项新技术。
我知道,如果我连尝试都不愿意,那确实是我的问题。所以我就决定:那就试试吧。后来我坐飞机的时候,终于有点时间思考,就开始想:
「这会不会是一次很奇怪的体验?」
然后我自己回答自己:「嗯,可能确实会有点怪。」
结果产品上线之后,我看到一些苗头了——因为 OpenAI 内部的人在测试期间,已经做了很多以我和其他人为主题的 meme。
那天我人在亚洲,半夜醒来发了条推文,就又睡回去了。六小时后醒来,我打开手机一看:全是 meme、meme、meme……
就这样被刷屏了。
最初几分钟确实觉得有点奇怪,但也就三分钟而已。之后我就释然了,觉得:「好吧,这就是一个充满生成视频的应用。」这些内容挺搞笑的,我也能乐在其中,笑一笑就过去了,并没有留下什么奇怪的感觉。
Rowan Cheung:我唯一有点担心的是那些「水印移除工具」。现在市面上有几家公司发布了这种功能,我看到有工具可以移除水印。
那如果我允许别人用我的形象,他们之后可能会把水印去掉再发到社交媒体上。这样会不会对我的个人品牌有负面影响?这个权衡该怎么做?
Sam Altman:首先,我们之所以愿意发布这种技术,是因为我们看到某些趋势已经不可避免地在靠近——无论几个月还是几年后,它都会变得广泛可用。届时会有优秀的开源模型,任何人都可以用它制作一段你的视频,让你「做」任何他们想让你做的事情,只要你在互联网上有公开资料,就有可能被生成。
当然,社会最终会适应这种变化,但我们认为,提前发布并设置好「防护栏」,是一种帮助社会逐步适应的好方法。我们以前在文本生成技术上也是这样做的。
视频则会更难适应,因为视频的冲击力远大于文字。
但我相信大家会学得很快——会很快意识到:网上将会出现大量没有水印、来源难以追踪的虚假视频,它们是由某个开源模型生成的,这种事是不可避免的。
所以,提前让社会「接种」这种现实的冲击,可能是有价值的。
Rowan Cheung:所以,「无法分辨真伪的视频」是目标吗?
Sam Altman:
我们最终的目标是 AGI(通用人工智能)。在实现 AGI 的过程中,高质量的视频生成会是非常重要的一环,原因有很多,特别是在我们从「世界模型」中学习的时候。
希望有一天我们能在机器人领域也取得真正的进展,那时视频也会非常关键。
而且我并不希望未来人类与 AI 的交互界面只有文字。我非常期待那种可以通过实时视频流与 AI 互动的未来,它能带来一种全新的用户体验。
所以我觉得这是好事。但更重要的是,我认为这条路对于通向真正的 AGI 来说,是非常关键的一步。
Rowan Cheung:你们上周五发了一篇博客,说你们正在探索「收入分成」机制,回馈那些允许用自己面孔生成内容的人。你可以多分享一些细节吗?这机制会怎么运作?
Sam Altman:可以。其实很多时候你发布一个新产品,用户的使用方式会超出你的预期。
我们原本以为会是少量创作者在用它制作一些很酷、很复杂的视频,然后被更大的观众群体观看和传播。
确实有一部分人是按照我们预期的那样在用这个产品,但实际上,更多人是为了自己和三两个朋友制作视频,然后发在动态里,或者只是在群聊中分享一下,不是公开发布在平台上。
我不确定这种用法是昙花一现的新鲜感,还是会持续下去。但如果它真的持续下去,那就会彻底改变我们对计算资源需求和用户互动方式的预期模型。也许我们会考虑允许用户付费生成视频。
比如说,你一天想生成 100 个视频发给朋友,那没问题。如果你还想让视频里出现某个名人,而那位名人愿意授权,那么他们也可以从中获得一定的生成收入分成。所以我们会在这方面做些尝试。
但我也得说,现在就对一个只有六十天的新产品下任何定论都还为时过早。也许这个方向最终根本不成立,也许这根本不是一个真正的「使用场景」,但至少到目前为止,它是一个挺大的趋势。
Rowan Cheung:你们有没有考虑过在这个产品里加入广告的可能性?
Sam Altman:
目前还没有,但我觉得这个方向确实有一些值得探索的地方。当然,它也有一些让人感到非常可怕的潜在风险。
不像 ChatGPT,那边我们已经跑得挺顺,有清晰的订阅制商业模式。而如果这个视频产品最终的主流用法变成:大家看搞笑内容或高质量视觉内容——那可能就更适合走广告驱动模式。
但如果大多数内容都是私密分享,比如私信里的视频,那就可能是完全不同的模式。
所以乐观来看,也许到今年年底——或者这可能太乐观了,可能要等到明年第一季度末,我们才能真正理解这个产品的最终形态,然后再根据它的走向设计相应的商业模式。
至少目前来看,我觉得按次计费、按生成数量收费,是一个合理的方式,值得我们去尝试。但其他的商业化策略,还要看产品接下来如何演化。
APPSO 注释:在 a16z 的采访中,Sam Altman 也强调,他对在产品中引入广告持谨慎的开放态度,并区分了他欣赏的广告(如 Instagram 上帮助用户发现新事物的模式)和不喜欢的广告(如 Google 搜索中干扰结果的模式)。
他强调,对于 ChatGPT 而言,用户的信任是绝不能破坏的核心原则。人们相信 ChatGPT 是真心想提供帮助,如果为了广告费而推荐并非最佳的产品,这种信任会瞬间崩塌,因此这种直接影响结果的付费推荐式广告是绝对行不通的。
未来的工作,可能也「不像工作」
Rowan Cheung:这个话题真的很有意思,关于「工作」的问题。工作的形态正在改变。我喜欢用「农民」类比来解释这件事。
比如你对 50 年前的农民说,有一个叫「互联网」的神奇东西,会创造出数十亿个新工作岗位,而且人们会坐在办公桌前工作、开发市场……他大概率是不会相信的。
现在我们正处在一个类似的时代——你和很多人都说过,AI 会创造出很多全新的岗位。但现在很难看清这些新工作会是什么。
这次和「互联网时代」的不同之处在于:互联网是从零开始创造了很多新职业,而这次 AI 的冲击,是先影响现有数十亿知识工作者的岗位,然后才可能出现新的工作机会。你怎么看?
Sam Altman:你说得非常对,我觉得你点出了一个很关键的点——这让我在某些方面没那么担心,但也在另一些方面更担心了。
关于那个农民,不只是他不会相信这种事真的会发生,他甚至可能会觉得你我现在做的这些根本不算「真正的工作」。
你想啊,农民每天种地,是在做大家真正需要的事——他们在生产粮食、维持生命,这才是「真正的工作」。
而在他们看来,我们这些未来人,生活太容易了,食物和财富都很丰富,我们做的事情更像是打发时间的「游戏」,只是为了找点存在感。他们会说:「这算哪门子工作?」
尽管对我们来说这份工作很真实,至少我自己感到很满足,也很感激自己能做一份既重要又有意义的事。
但也完全有可能,如果我们现在能看见未来那些新工作,我们会说:「好吧,也许我们的工作比不上农民的真实感,但肯定比未来这些『自娱自乐的游戏』更像工作。」
所以我真的相信——是的,人类将来依然会有目标、有动力,但我们对「工作的理解」会发生巨大变化。
在未来人眼中,我们现在的工作,可能也会显得「不那么像工作」。
我也相信,社会契约会随之改变,尤其是当这个转变发生得非常快的时候。
所以我确实对这场转型的短期阶段感到有些担忧。但说到底,我依然非常相信人类的动力与创造力,我们一定会找到值得去做的事情。
Rowan Cheung:比如探索太空,希望看到更好的 AI 系统等等——你觉得在 AGI 实现之后,人类最有可能会集中精力去做什么?
Sam Altman:我其实更希望——我们能「全面开花」,什么方向都去探索。
太空探索当然很酷,我自己也很感兴趣。但也许你、你,还有你,各自会对别的方向感兴趣。我希望那个时代的「可能性画布」能变得无限宽广,大家都能去做自己真正感到兴奋的事。
Rowan Cheung:如果你明天可以制定一项全球性政策,你会选择什么?
Sam Altman:这真的很难只选一项。但我脑海里一直浮现的,是关于 AI 监管的激烈争论——到底它是好是坏?是否会让大公司获利太多?
我能理解这些争议的各个方面。但我确实认为,随着模型变得越来越强大,我们需要一个全球框架,来降低潜在的灾难性风险。
尤其是在那些处于前沿的模型上,我们必须认真思考最严重的安全问题。如果能有一项全球政策来应对这个问题,那将是非常有意义的。
Rowan Cheung:你能简单概括一下这个「全球框架」会是什么样的吗?
Sam Altman:一开始我会从一个完善的测试机制入手,作为基础。
Rowan Cheung:我还想聊聊「超级应用」这个话题。在中国,像微信这样的「超级 App」已经涵盖了几乎所有功能:购物、支付、聊天……
而现在 ChatGPT 也开始支持购物、网页搜索、Sora 视频生成等功能。你们是不是也打算打造一个「美国版的超级 App」?
Sam Altman:不是的。嗯,有很多原因让我觉得这种模式在美国市场并不适用,至少不能用同样的方式去复制。
我们的目标并不是做「超级 App」,而是要构建一个真正强大的 AI 超级系统。
Rowan Cheung:那为什么你们要把这些功能分开发布?比如 Sora 是一个独立的应用,为什么不直接集成到 ChatGPT 里?
Sam Altman:因为对很多用户来说,ChatGPT 是他们最私人的账号之一。
如果把一个「社交体验」也强行塞进去,感觉会很奇怪。你可以想象加入一些「消息」功能,因为很多人确实会分享内容、进行协作。但从用户心态来看,他们对 ChatGPT 的认知,和对一个娱乐类 App 的认知是完全不同的,混在一起会有割裂感。
当然,我们也会把很多功能直接加到 ChatGPT 里,但有些东西还是更适合独立发布。
Rowan Cheung:我们再聊聊智能体。你觉得现在人们可以构建哪些真正重要、有用的 Agent?你最看好哪一类?
Sam Altman:我觉得可以参考一下 Codex 的发展,然后把这种思路推广到其他行业。
比如:能不能为法律、金融建模,或其他我们已经看到早期成功案例的领域,打造像 Codex 一样的体验?其实现在已经有一些很棒的初创公司在做这些方向了。
随着技术的成熟,如果你能让这些 Agent 在各自行业中,做到像 Codex 在编程领域那样强大,那将是我最感兴趣的方向之一。
我可以想象未来这样的场景:
一个人只需要和一堆 Agent 对话,就能启动一个公司。现在的 Agent Builder 和 AgentKit 还没完全达到这个水平,但我能看到我们正在往这个方向靠近。
Rowan Cheung:我记得你在主题演讲里提到,「语音」可能会成为 AI 智能体的最终界面。你能展开讲讲吗?
Sam Altman:我不觉得语音是最终的交互方式。很多场景下,语音其实并不适用——比如在公共交通上,和设备对话就很不方便,甚至有点尴尬。
但在很多情况下,语音确实是一种非常自然的交互方式,尤其是语言本身的交流。尽管有时候,打字仍然是更合适的方式。
我觉得我们其实低估了语音交互的潜力。大家现在总是拿智能音箱这个类别开玩笑,但我们忽略了,其实很多人真的在用这些设备,而且很喜欢它们——尽管它们现在的体验还很差,主要是因为以前的 AI 不够好,生态基础也没跟上。
但你想想未来会怎样:如果你能随口对设备说一句,它就能完全准确地帮你完成任务——那种感觉,可能就真的像拥有了一个「理想中的计算机」。
Rowan Cheung:我很期待能够使用它。能不能透露一点关于你们在 I/O(设备端)正在做的事情?是不是会有语音交互?
Sam Altman:我们还需要一段时间。这个方向确实需要大家多一点耐心。
要做出一种全新类型的设备,而且要达到极高的品质标准、还能大规模生产,这等于是重新定义人与计算机的交互方式。我们需要一定的创作空间来把这个事情摸索清楚。
我们确实有一些非常令人兴奋的想法,但目前还不准备公开谈论,而且在短期内也不会说太多。但我们会努力做出一个真正值得使用、非常有意义的产品。
Rowan Cheung:好吧,那今天就聊到这。
Sam Altman:非常感谢。
欢迎加入 APPSO AI 社群,一起畅聊 AI 产品,获取
#AI有用功
,解锁更多 AI 新知
👇
我们正在招募伙伴
📮 简历投递邮箱
hr@ifanr.com
✉️ 邮件标题
「姓名+岗位名称」(请随简历附上项目/作品或相关链接)
更多岗位信息请点击这里🔗
Python社区是高质量的Python/Django开发社区
本文地址:
http://www.python88.com/topic/187657
登录后回复