OpenAI深夜重磅发布新一代ChatGPT智能体：连接研究与实践的创新飞跃

摘要：
OpenAI最新发布的ChatGPT智能体，将Operator与深入研究的能力有机融合，在实际任务中具备自主推理与行动能力，显著提升网页交互、数据分析与办公自动化等场景下的效率，其评测成绩也达到了业内领先水平。ChatGPT 现已具备自主思考与行动的能力，能够主动从其智能体技能库中选择合适的工具，利用网络完成任务。本文将详解ChatGPT智能体的革新特性及应用价值，并配以相关数据和图表。

https://openai.com/zh-Hans-CN/index/introducing-chatgpt-agent/

隆重推出ChatGPT智能体：连接研究与实践

“ChatGPT现已具备自主思考与行动的能力，能够主动从其智能体技能库中选择合适的工具，利用网络为您完成任务。”

OpenAI正式发布了全新的ChatGPT智能体，该系统能够借助自有虚拟计算机为用户独立完成复杂任务，实现从推理到执行的无缝切换。它将Operator对网站的交互能力、深入研究的信息整合优势，以及ChatGPT本身的强大对话能力融合为一体，形成了统一的智能体大战略，不仅能高效处理财务、市场研究，还能自动填写网页表单和生成图表或演示文稿等多种内容。

一体化解决方案：从交互到深入研究

ChatGPT智能体可智能浏览网站、筛选数据、辅助安全登录、执行代码，并生成可编辑、易于复用的输出内容（如PPT、电子表格），全面覆盖信息收集与整理需求。用户始终掌握操作主控权，重要步骤前系统会先征求用户同意，任何时刻都可中断、接管或停止任务。

新一代智能体的发布只是起点。OpenAI表示将在今后持续高频率地迭代和扩充智能体功能，使其长期服务于更广泛人群。

Operator与深入研究的融合演进

Operator原本专注于交互式网页操作（如滚动页面、点击、输入信息），而深入研究则长于批量分析与多步逻辑推理。例如，Operator无法独自生成详尽分析报告，深入研究则无法自动处理需认证访问的网页内容。实际应用中，许多复杂查询正需要两者能力结合。

因此，OpenAI将二者的互补优势集成入ChatGPT智能体，并赋予其额外工具，使其在同一会话中主动点击、筛选、收集，获得更高效、精准的结果。用户还可以在对话过程中，随时把需求升级为实际指令，真正实现“从问答到行动”的一体化体验。

多模态与协作式工具链

ChatGPT智能体具备多元网络访问和交互方式，可自动选择最优工具组合。例如，通过API瞬时获取体育数据、财务数据，或采用可视化浏览器与普通网页交互。所有操作都托管在安全的虚拟计算环境中，不论工具如何切换，任务上下文始终贯通，全流程背景信息自动共享。

模型专门训练以动态最优化——每步自动评估选用何种工具，从而提升速度、准确性与效率，支持灵活、迭代式任务协作。运行期间，用户可随时澄清指令、暂停流程、请求阶段性摘要或重新定向目标，模型则能在不中断进展的前提下灵活调整。

安全与主控权

ChatGPT智能体所有任务执行都遵循用户主控原则。它会主动请求更多细节、必要时求证关键操作，并允许用户通过“接管浏览器”功能自行登录敏感内容网站，进一步增强研究和数据处理的广度与深度。

实力评估：行业领先表现

1. 人类的最后考试（Humanity’s Last Exam）

该考试以专家级真实世界问题评估AI多学科能力，ChatGPT智能体取得了43.1分新高，远超业界标杆。

表1：多模式对比 - 专家题准确率

评测工具	准确率pass@1
OpenAI o3 (无工具)	20.3%
ChatGPT agent (无工具)	23.0%
OpenAI o3 (python+浏览)	24.9%
深入研究 (python+浏览)	26.6%
ChatGPT agent (全工具)	41.6%

2. DSBench数据科学评测

在数据分析与建模任务上，ChatGPT智能体表现大幅超越人类，Key Results如下：

数据分析准确率
：人类 64.1%，ChatGPT智能体 89.9%
数据建模准确率
：人类 65.0%，ChatGPT智能体 85.5%

3. SpreadsheetBench电子表格能力评测

ChatGPT智能体基于实际场景处理编辑任务，成绩显著高于行业前沿：

GPT-4o（Windows）：18.4%
Copilot in Excel：20.0%
Human：16.8%
ChatGPT agent：35.3%
ChatGPT agent（直接访问.xlsx）：45.5%
人类最高：71.3%

实际应用价值拓展

ChatGPT智能体的统一工具链极大扩展了其实用性。专业场景下，它可自动将截图转换为可编辑PPT，规划会议、定外出活动，并智能更新电子表格。个人生活中，能够一键规划并预订旅行、设计晚宴活动、快速找专业服务并安排预约等。

用户只需在编辑器工具菜单选择“智能体模式”，即可在任何会话阶段激活全面的新功能。

结语

ChatGPT智能体的推出标志着AI办公、研究、生活助手进入新的高度，它打破了传统“只会聊天”的边界，成为真正以任务为中心的AI专家、助理和执行者。面向未来，这一平台还将持续进化，为更多复杂场景带来强有力的支持。专业人员将能以此为基础，推动信息处理、决策和生产力工具的全面升级。