Py学习  »  chatgpt

ChatGPT与Codex彻底并轨:“想”和“写”的边界正在消失 ,第一个属于开发者的“桌面超级应用”真的来了

51CTO技术栈 • 1 周前 • 52 次点击  

作者 | 大石

你有没有过这种体验:在ChatGPT里跟AI聊了半天需求,方案终于理清楚了。然后你发现,刚才聊的所有上下文,得重新给Codex讲一遍。

反过来也一样,Codex跑到一半卡住了,想切回ChatGPT讨论一下思路,又得从头交代背景。一天来来回回折腾很多次,上下文全在自己脑子里,出了错还得自己排查。

OpenAI显然也看到了这个问题。过去几个月,他们一直在做一件事:ChatGPTCodex深度整合。账号打通了,界面融合了,手机和电脑能联动了。

新发布的公告中,OpenAI展示了这套整合的最新进展,同时还抛出了GPT-5.5AWS Bedrock上线的消息。

但当天所有消息里,分量最重的始终是整合本身。

当聊天和编码的边界开始消失,开发者的工作方式会发生连锁反应。这篇文章,从一个开发者的视角,聊聊这次合体到底做了什么,意味着什么,以及接下来可以怎么用起来。

ChatGPT+Codex到底合了什么?四个动作拆解

先理清楚时间线,ChatGPT和Codex整合不是突然出现的20255 16日,Codex作为独立的云端软件工程Agent正式发布。

20262月,Codex桌面App上线。3月左右,外媒传出OpenAI的计划:把ChatGPTCodexAtlas浏览器整合成一个Desktop Superapp

到了5月,Codex开始深度嵌入ChatGPT的移动端和桌面端体验。这次的发布会,可以看作这套整合的第一个里程碑。

所以准确说,这是一次持续了半年多的渐进式整合,不是一个突然的合并公告。但6月这个节点确实值得关注,因为整合已经到了很高的程度。具体做了四件事:

第一,账号体系统一。你现在用一个ChatGPT账号,就能登录Codex全家桶:Web端、桌面AppIDE插件、移动端。不用注册两遍、登录两遍、配两遍环境。这事听起来很小,但你想想,每次换个工具就要重新登录、重新授权、重新加载上下文,这些摩擦累积起来才是真正吃掉效率的东西。

第二,任务流打穿了。Codex在后台跑着任务,你在 ChatGPT界面里能实时看到进度、能继续对话、能中途插手改方向。更重要的是,你在ChatGPT里聊需求的上下文,会直接带进Codex的编码任务里。Agent知道你之前聊过什么,不用你再说一遍。

第三,跨端联动了。电脑上起一个Codex任务,出门了打开手机上的ChatGPT App,能实时看到跑到哪了,能发消息干预。这解决了一个很实际的痛点:长周期Agent任务跑起来可能要几个小时,你不可能一直坐在电脑前盯着。现在手机上就能掌握进度,需要做决策的时候随时介入。

第四,Superapp已经在路上了。OpenAI的规划比当前看到的更大。ChatGPT管对话和思考,Codex管执行和交付,Atlas浏览器管信息检索和网页操作,三个产品最终会合成一个桌面超级应用。

同一个窗口里,左边聊需求,右边出代码,下面跑着终端。不再是为了做一件事打开三个不同应用的体验。

双面冲击波:打通带来效率暴涨,也暗藏隐形使用风险

先说好的部分。

工作流变短了。以前是ChatGPT聊需求,聊完复制粘贴到IDECodex写代码,写一半卡住了再切回ChatGPT讨论,讨论完再切回来继续写。每一步都在损耗上下文。现在聊完需求直接转执行,中间不再断。这不是少点了两下鼠标的问题,是上下文保住了,Agent的输出质量会跟着提升。

长周期任务终于不用把人绑在电脑前了。这是跨端联动带来的最大变化。起一个涉及十几个文件的重构任务,Codex可能要跑一两个小时。以前你得时不时回来看看是不是卡住了、方向对不对。现在手机上随时瞄一眼,发现跑偏了即时纠正。你不需要7x24小时工作,但你的Agent可以,前提是你能随时知道它在干什么。

全生命周期管理变成可能。 从需求讨论到方案设计,从编码实现到测试部署,全过程在一个界面里拉通。每个阶段的上下文自然传递到下一阶段,不用反复交代我们之前在做什么。这对复杂项目尤其有价值,因为复杂项目最怕的就是中间的信息损耗。

使用门槛下降。Codex目前周活用户突破500万,比2月翻了6倍。更值得关注的是,知识工作者占了20%,增速是开发者的3倍。

产品经理在用Codex分析数据、出报告,运营在用Codex管项目、写文案。而且Codex已经包含在所有ChatGPT套餐里,包括免费版,只是各档配额不同。入口越简单,用的人就越多,这件事跟你写不写代码关系不大了。

但也有些需要留意的地方。

界面复杂度是个隐患。功能越堆越多,怎么保持操作体验不失控,是OpenAI接下来要面对的问题。你用过那种什么都能做但你永远找不到在哪做的软件吗?超级应用最大的坑就在这儿。前几版整合界面大概率会有各种小问题,做好心理准备。

依赖单一平台的风险变大了。当你的需求讨论、代码编写、测试部署全都在一个平台上完成,切换成本就会变得很高。万一哪天OpenAI改了定价、改了策略、改了服务条款,你的整个工作流都会受影响。这不是说不要用,是说得有个Plan B。后面实战建议里我会聊具体怎么做。

Token消耗模式会变。以前分开用的时候,你会下意识地控制每个工具的用量。现在一体化了,Agent在后台持续跑着,上下文自动传递着,token消耗可能会比你预想的快。

Codex的用量走的是Agent使用限额,跟ChatGPT for ExcelWorkspace Agents共享一个池子,任务越大、上下文越长,单条消息吃得越多。GPT-5.5token效率确实比同类模型高约3倍,但前提是你得主动去管。PlusPro用户超限了可以充值续用,其他套餐得等重置。工具一体化的另一面,是成本也需要一体化的意识。

3大落地实战场景+省钱指南,手把手用好合体新能力

聊完影响,聊聊怎么用。下面这几个场景,最能体现合体价值的。

场景一:需求讨论直转执行。ChatGPT里跟AI把需求聊透,确认方案没问题之后,直接让Codex开始写。你不用把讨论内容总结成一段prompt,上下文已经在对话里了。关键在于第一步要把需求聊透,别急着让AI写代码。需求讨论阶段多花10分钟,后面能省2个小时的返工。

场景二:多文件重构全流程管理。改哪些文件、为什么改、改完怎么测,先在ChatGPT里把计划列清楚。然后让Codex去执行,你在界面上盯着进度。改到一半发现某个模块的方案不对,随时介入调整方向,不用等它全跑完再推翻重来。跑完之后,让Codex自己跑一遍测试,你在同一个界面里看结果。从头到尾,不离开一个窗口。

场景三:移动端盯长任务。代码写完了,让Codex跑全量测试、做代码审查、生成文档,这些任务动辄一两个小时。电脑上起任务,手机上装好ChatGPT App,开会、吃饭、通勤的时候瞄一眼进度。发现测试挂了,手机上直接告诉它修哪个方向。不用赶回电脑前,不用焦虑地等结果。

成本优化的几个原则。第一,模型分层用。GPT-5.5虽然token效率高,但也不是所有任务都需要它。重型推理和复杂重构给它,简单补全和格式整理给便宜模型。第二,Prompt Caching拉满。

合体之后你的对话轮次会明显变多,重复上下文走缓存,成本能骤降一个数量级。第三,搭一个本地模型做隐私兜底。涉及密钥、内部接口、业务敏感数据的任务,走本地开源模型,别往云端发送。

M3模型611日就开源了,OllamavLLM大概率会快速适配。第四,留意数据训练控制。如果你是 Plus 或 Pro 用户,去ChatGPT设置里关掉为模型改进提供数据的开关,你的代码就不会被拿去训练。BusinessEnterprise默认不训练,不用额外操作。

AI是队友,不是导师。

合体之后的Codex看起来什么都能干,但架构设计、业务判断、安全审查,这些还是你的事。

它写代码,你把关。Agent跑得再顺,最终为代码负责的还是你。这个分工,工具再进化也不会变。

从“聊天气泡”进化成全链路开发工作平台

把时间线拉长来看,这次合体不是OpenAI心血来潮加个功能。它是一个信号:OpenAI正在从聊天工具完整工作系统转型。

Chatgpt管思考和沟通,Codex管执行和交付,Atlas管信息获取。三个东西拼在一起,就是一个能覆盖开发者大部分日常工作流的超级应用。

年初Claude Code在开发者圈子里一战成名的时候,大家讨论的问题是:Agent这个品类到底行不行?

半年过去,问题已经变成了:你用的Agent是谁家的?现在OpenAI往前走了一步,问题又变了:你还需要分别打开好几个 Agent 吗?

行业趋势是清楚的。

单一功能工具会逐渐被超级应用替代,因为上下文连续性这件事,比单个功能的极致性能更重要。一个Agent能记住你今天聊过什么、昨天改过什么、上周项目进度到哪了。三个各自为战但功能更强的工具,反而不如一个能记住你全部上下文的Agent更省力

但对开发者来说,工具变少了,对判断力的要求反而更高了。以前工具分散的时候,你在哪个阶段用哪个工具,是主动在做选择。现在工具一体化了,如果不加区分地全丢给它,很容易变成AI说什么就是什么。用好一个全能工具的前提,是你比它更清楚什么该做、什么不该做。

Anthropic拼深度, OpenAI拼广度,两大路线怎么选?

从这次发布来看,OpenAIAnthropic的路线正在拉开。

Anthropic打深度。Claude Code在开发者群体里的忠诚度极高,CoworkAgent能力从程序员扩展到了知识工作者。

一个开发者可以在Claude Code里泡一整天,精细调教,深度集成到自己的开发环境里。

OpenAI打广度。把Codex揉进ChatGPT,一步推到10亿用户面前。不需要下载,不需要配置,打开已有的对话框就能用。加上AWS这条线,企业不需要另起一套审批流程,在已有的基础设施上直接接入。

两种路线没有对错。同样做多文件重构,你可以在Claude Code里精细调教,也可以在ChatGPT里直接让Codex开工。对开发者来说,选择多了,切换成本低了。

结语

ChatGPTCodex的这次合体,不是一夜之间完成的,但方向一直没变:让你不用在好几个工具之间来回跳,让Agent就在你已经在用的对话框里等着。对开发者来说,好处是工作流更短了、上下文保住了、长任务不用死盯了。需要留意的是平台依赖、界面复杂度,还有成本管控。

打开ChatGPT,看看Codex已经在里面能做什么了;把你手头正在做的一个项目丢进去跑一遍,感受一下全流程打通的体验;想一想你的日常工作里,哪些环节最适合被Agent接管,哪些环节必须自己把关。

工具在进化,但一个老道理没变:工具越强,用工具的人越重要。

你现在的工作流里,Agent占了多大比例?Codex合并ChatGPT之后,有没有哪个场景你想第一个试试?评论区见。

参考链接:
https://x.com/OpenAI/status/2061887650391625870?s=20

——好文推荐——

AI最大的瓶颈是工程师?Anthropic联创:向AI巨头征税!一年内将出现同等能力的开源模型!硅谷大佬陷入“安全套娃”?

MiniMax  M3炸场后,引发的连锁反应:国产大模型正在跨越怎样的工程新周期?

写了54万行代码的顿悟!YC总裁Garry:编程能力≠代码行数,Markdown才是新编程方式,软件工程新瓶颈是人的意图清晰度





Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/197249