OpenAI深夜突发Agent指挥中心：一句话，700万token烧出高逼真3D赛车游戏，内部Skills全开源！免费可玩，网友:界面太随意了，套壳ChatGPT

编辑 | 云昭

凌晨，OpenAI 的一款全新的 macOS Codex App，一经发布就瞬间引来业界的热议。

OpenAI 的开发者体验与生态负责人 Romain Huet 在同步放出的不到5分钟的视频中透露了，OpenAI对这款 App 的定位：一个用于构建 Agent 的指挥中心！

“现在，你可以在一个地方统一管理项目，并把真正的工作交给 Codex 去完成。你不再需要来回切换多个终端窗口，而是拥有一个单一的指挥中心，用来运行和监督 Agent。”

OpenAI的野心：原来的IDE和终端工具都不适用了

Codex App 的定位，野心很大。

如果你对比酷似 VSCode 的Cursor和纯 CLI 的 Claude Code，Codex App 的确非常另类。既不是复杂的编程 IDE 界面，也不是聊天窗口，当然也不是 CLI。

它的界面，左侧是项目列表，每个项目下，你都能看到 Codex 已完成的任务，其中有些此刻还在实时运行。右侧则是主对话界面。

乍一看，Codex App 有点像淡蓝色背景的 ChatGPT，细看之下又有点像精简版版 IDE。

这背后的原因，自然是 OpenAI 对它的目标定位不同：Codex App 是专为管理多个 Agent 的工作平台。

OpenAI 官网上表示这一定位源自于开发者与智能体协作方式发生了根本性的变化。

模型已经能够端到端处理复杂、长时间运行的任务；
开发者开始在项目层面编排多个 Agent：分配任务、并行执行，并将持续数小时、数天甚至数周的大型工作放心地交给Agent完成。

简单理解下，现在不少重度的AI玩家已经习惯了三件事：

一、多个 Agent 同时工作；

二、任务可以跑几个小时、几天，甚至几周；

三、从“写代码的人”，变成“指挥、审核、切换上下文的人”。

OpenAI认为，现在智能体开发的挑战核心，已经从“智能体能做什么”，转移到了“人如何在规模化场景下指挥、监督并与 Agent 协作”。

但，现有的 IDE 和基于终端的工具，并不是为这种工作方式设计的。

OpenAI 判断：这种新的构建方式，加上模型能力的跃迁，需要一种完全不同的工具。

这也就是 Codex 桌面 App 诞生的原因。

激进的产品设计

为此，Codex App 做了几件很激进的事，可以说设计的功能点非常超前。概括来说，有以下几点：

Agent 按项目、按线程独立运行
内置 worktree，让多个 Agent 同时改同一个仓库
引入 Skills，把能力从写代码扩展到“操作真实世界工具”
用 Automations 让 Agent 在后台定期干活

这里，小编来挑几个觉得印象深刻的功能点。

内置工作树，智能体互不冲突

首先是内置 worktree 的设计，这样就可以让每个智能体都在一份隔离的代码副本中工作，而用户则可以同时探索不同实现路径，而无需时刻担心对主代码库的影响。

想一下这个场景：

让 A 智能体用方案一重构、让 B 智能体用方案二重构、让 C 智能体直接推翻重来
这三个重构方案可以同时运行、互不冲突、而且还不污染主分支

这样开发者不需要再事前纠结“哪个方案更好”了。

到时候看下这三个方案，最后取一个更合心意的方案即可。

叠加 Skills，一句话搞定3D赛车游戏

OpenAI内部Skills开源

再一个就是 Skills。

去年下半年以来，Skills 被 Claude Code 带火了。一个 Skill 里通常包含：指令、脚本、外部工具、工作流程。

Codex 借助 Skills，能稳定地连接工具、运行工作流，并按照团队偏好完成任务。用户进而可以轻松将 Codex 的能力扩展到信息收集与整合、问题分析、写作等更广泛的任务。

比如，Codex 不仅可以写代码，还可以：

拉 Figma 设计稿，直接生成 UI 代码
在 Linear 里分流 bug、推进项目
把网站部署到 Vercel、Cloudflare
生成图片、改 UI、做游戏素材
读写 PDF、表格、文档

OpenAI 还给了一个非常夸张但真实的例子：

Codex 用 700 万 tokens，从零做了一整款 3D 赛车游戏。包含不同角色、8 张地图，以及玩家可通过空格键使用的道具。

上面这个例子中，Codex 使用了图像生成 Skill（由 GPT Image 驱动）和网页游戏开发 Skill，仅凭一次初始提示，就独立完成了整个项目，累计使用超过 700 万 tokens。

在这个过程中，Codex 同时扮演了设计师、游戏开发者和 QA 测试员，甚至通过实际游玩来验证自己的成果。

还是那句：“感受AGI！”

为此，Codex App 还提供了专门的界面来创建和管理 Skills。用户既可以明确要求 Codex 使用某个 Skill，也可以让它根据当前任务自动选择。

更 Open 的是，OpenAI 还将自己内部构建的许多 Skills 也开源了出来。

传送门：https://github.com/openai/skills

Codex 自动化：OpenAI内部都在用

另外，Codex App 里还有一个容易被忽略，但会慢慢改变工作节奏的功能：

Automations。

简单理解，点击这项功能，用户就可以设定希望自动化执行的任务：

每天自动跑 issue 分流
自动汇总 CI 失败
自动生成发布简报
自动检查潜在 bug

这些任务会在后台运行。

更厉害的来了，自动化任务还可以将指令与可选技能相结合，并按照用户设定的时间表运行。自动化任务完成后，结果会进入审核队列，以便用户在需要时可以随时返回并继续工作。

所谓“关上 Mac，去喝咖啡”，不用死盯着屏幕的名场面，往后会越来越多地出现。等你回来或上线时，结果已经在等你审阅。

这一步，意味着 AI 从“工具”变成了：

团队里的异步成员。

博客中还透露，在 OpenAI，团队一直使用自动化来处理重复但重要的任务，例如日常问题分类、生成每日发布简报、检查错误等等。

丝滑流畅：几个任务并行跑，用嘴就够了

值得注意的是，Romain 还展示了一个“迁移”项目。演示中，Codex 更新了所有所需的依赖项，甚至在这个任务中“Speech to Speech”的集成从 WebSockets 迁移到了 WebRTC。

趁着这个时间，Romain 也没闲着，给 Codex App 发了一个新任务，写一款健身应用。

假设我想为它增加新功能，我可以直接输入，或者干脆说出来进行语音输入：新增一个页面，用来展示 NASA 的“每日天文图片”。就这样，Codex 已经开始替我处理这一切，并会自动找到合适的 API 来完成实现。

总之，如果你想添加新功能，用嘴就够了。

贴心 Buff：

自动集成 CLI 会话历史，两种可选个性化配置

另外，小编还注意到两个贴心的地方：

其一，Codex App 会自动继承用户在 Codex CLI 和 IDE 扩展中的会话历史与配置，因此用户可以直接在现有项目上无缝开始使用。

其二，可选的个性化设置。不同人喜好不同的智能体协作风格。有的朋友希望直接、结果导向；有些人更偏好交流充分、过程透明。

Codex App 目前给到了两种可选个性：简洁务实 与 更具对话感和同理心。能力完全一致，仅交互风格不同。

用户可以通过 /personality 命令在 App、CLI 和 IDE 扩展中切换。

权限安全，按需配置

此外，在安全方面，Codex App 使用了与 Codex CLI 相同的、原生的、开源的系统级沙箱机制。

默认情况下，智能体只能编辑其工作目录或分支内的文件，并使用缓存的网页搜索；当需要更高权限（如网络访问）时，会主动请求用户的许可。

当然最近 OpenClaw 的爆火，也让业界看到了“极高权限”带来的创造力。为此，Codex App 也支持为项目或团队配置规则，允许特定命令在无需确认的情况下自动以更高权限运行。

全面开放，限时免费可用

至于可用性上，OpenAI宣布，在限时期间，Codex 将包含在 ChatGPT Free 和 Go 中；并且我们将 Plus、Pro、Business、Enterprise 和 Edu 方案的速率限制提升一倍。

也就是订阅费更高的用户可以享受更高的速率。

同时，这个规则在 Codex 的所有地方都生效：App、CLI、IDE，以及云端。

网友炸了：你们做的还是“套壳聊天框”

正如上文所提到的，这款 App 远看之下，跟 ChatGPT 界面很像。

虽然各种功能设计都很 amazing。但眼睛雪亮的网友却从不放过。

HackerNews 上最激烈的观点认为：

“这款桌面 App 从 UI 上看，本质还是聊天窗口。”

他们的核心质疑有三点：

复杂度不成立：Blender、Unity、UE5、Godot、各种游戏 UI，复杂度都高得多，也没见人非 Electron 不可。
Agent 工具理应深度集成 OS：Codex、Claude 这种“长期协作型 AI”，按理说要大量调用系统级 API。Electron 在这件事上天然吃亏。
性能不是玄学问题：内存占用高、UI 延迟、风扇起飞，这些是“低频投诉、高频痛苦”。

有网友直接点名 Codex 的内存占用情况：

“8GB 内存占用，已经是小丑级别了。”

不过，并不是所有网友都这么较真。甚至认为这款桌面版 Codex 注定是一款阶段性产物。

理由是：

AI 公司现在的瓶颈不是体验，而是用户增长、能力迭代、产品试验速度。

甚至有网友举了一个例子来说明：界面跟功能比起来，用户无疑还是更倾向功能。

Slack、Adobe、Salesforce 全是 Electron，它们缺用户吗？

看得出来，大家整体上对于这款 Codex App 的功能还是没意见的。

问题只是出在了 UI 上：为啥看起来这么“随便”？

参考链接：

https://news.ycombinator.com/item?id=46859054

https://openai.com/index/introducing-the-codex-app/

现象级产品OpenClaw创建者：80%手机App会被吃掉！自曝“扩充军团”的秘法：逆向三方API！称长时程Agent不过是虚荣指标，不相信复杂编排！

CC之父曝内部团队使用Claude Code的10条技巧！同时启动3-5个工作树，重度投入CLAUDE.md文件；网友：工作流很管用，但钱包有点痛