社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

OpenAI 发布通用型 ChatGPT 代理,以应对 Excel、PowerPoint 和 Chrome 浏览器的挑战

InfoQ • 2 月前 • 88 次点击  
作者 | Andrew Hoblitzell
译者 | 平川

最近,OpenAI发布 了 ChatGPT 代理,它将 Operator 的浏览技能和 Deep Research 的总结能力整合到单一的“ChatGPT 代理”中。现在,开发者不再需要将代码或公式片段粘贴到 ChatGPT 中,然后再将答案复制到生产力应用中,而是可以提示一个工具来收集数据、对其进行推理,并一次性返回一个可编辑的电子表格或幻灯片。

该代理通过在后台发出 Python 代码来编写有效的.xlsx 和.pptx 文件,其输出可以在 Excel、LibreOffice、PowerPoint、Keynote 或任何理解开放格式的库中打开。企业家早期的实践笔记指出,即使是简单的一行提示也能生成连贯的幻灯片。在聊天窗口背后,代理可以在 GUI 浏览器、文本浏览器、类 POSIX 终端和直接 API 调用之间进行选择。它可以通过“连接器”登录到 SaaS 工具,使用文本浏览器抓取表格,运行终端中的代码进行数据整形,并将结果放入 LibreOffice,然后提供下载链接。

在 SpreadsheetBench 上,ChatGPT 代理的准确率达到了 45.5%,而 Copilot-in-Excel 仅为 20%。OpenAI 还声称,ChatGPT 代理在 DSBench 和 BrowseComp 上取得了一流的成绩,在 Humanity's Last Exam 上一次通过率达到了 41.6%,但这些基准测试都假设代理被允许运行代码和浏览。

我会向我自己的家人解释说……在有机会在实际应用中研究和改进它之前,我不会把它用于高风险的用途或处理大量个人信息。


—— Sam Altman

从开发者的角度来看,代理只是又一个 ChatGPT 工具选项,你基于 Assistants API 构建的任何东西都会自动继承它。通过连接器可以将代理指向私有 GitHub 存储库或 Grafana 面板,而 Generative-Excel-Data-Assistant 等 GitHub 项目和 Azure 的“assistant-agent”笔记本则展示了如何将工作流嵌入内部应用程序。像 awesome-ai-agents 这样的社区列表收录了数十个类似的开源项目,你现在就可以开始创建分支。

该功能是在 OpenAI 经历了一个 “坎坷的夏天”之后推出的,但仍然成了一项引人注目的胜利。TechRadar 在实测中让它规划了一个到东京旅游的行程,并生成了一个格式化的表格。另一方面,基准测试显示了不同的结果。早期的 ZDNet 基准测试发现,在多步骤任务中,只有八分之一可以在不产生幻觉的情况下完成,而 The Information 引用了一位测试者遇到的情况,一个人类在 15 分钟内就能完成的任务,他等了 30 分钟。OpenAI 也做了说明,当代理同时处理多个工具时风险更高、运行时间更长。该公司最近与 Gemini 和其他深度推理模型共享了 IMO Gold,而 Alexander Wei评论说 该公司“很快将发布 GPT5”。

你可能不会看到软件的完全压缩,其中只有一个代理和一个数据库,因为工作流和公司特有的业务流程中有很多逻辑需要构建到数据库中或围绕数据库构建……代理会在 1% 的时间里犯错误,它会与某人分享错误的东西或向错误的人开放访问权限。


—— Box CEO Aaron Levie

高质量的标记数据仍然是每个代理工作流所赖以生存的氧气。这也解释了为什么 Meta 刚刚开出了一张价值 140 亿美元的支票,用于购买 Scale AI 近一半的人工合成图像、代码跟踪和 RLHF 示例,供未来发布的 Llama 使用。。像 亚马逊 Mechanical Turk 这样的众包主力仍然在填充边缘案例提示的长尾,而像 Turing 这样的其他初创公司现在拥有超过 400 万专家标记员,并且收入增长了三倍,达到 3 亿美元,为那些对 Meta 的新窗口保持警惕的实验室提供了一个中立选项。

希望实施代理的开发者应该将输出视为草稿资料,执行沙盒凭证并捕获日志——这是生态系统成熟过程中的奠基性实践。如果你想了解更多信息,请参考 系统卡片。

原文链接:

https://www.infoq.com/news/2025/07/openai-chatgpt-agents/

声明:本文由 InfoQ 翻译,未经许可禁止转载。

点击底部阅读原文访问 InfoQ 官网,获取更多精彩内容!

今日好文推荐
996 工作制席卷硅谷!招聘启事惊现“加班警告”:接受就是年薪翻倍+股权暴增,不接受就滚蛋
文件被 Gemini 当场“格式化”,全没了!网友控诉:Claude、Copilot 也爱删库,一个都跑不了
AI 编码史诗级翻车现场!刚刚,Replit 一键删光客户整个生产数据库,官方连夜补锅
创始人“背刺”员工获财富自由,Devin 接盘火速兑现员工期权,华人 CEO 暗讽:做个人吧!

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/184866