2025 年刚开年,OpenAI 就推出首波智能体“Tasks” ,不到 10 天,OpenAI 又放了个大招,紧随其后,发布全新智能体 ChatGPT Operator。

这次不仅要挑战自己,也要直接对标 Anthropic 的 Claude Computer Use。
在多项基准测试中,Operator 的表现可谓十分亮眼,尤其是在 WebVoyager 测试中,成功率高达 87%。

那么,ChatGPT Operator 到底有什么过人之处?
作为早期体验者,The Rundown AI 的创始人 Rowan Cheung 对ChatGPT Operator 进行详细的内测。
以下是他分享的一些体验,真的让人感到震撼。
1. 用图像和食谱购买晚餐食材
假设你已经看中了某个食谱,甚至拍下了食材的照片,过去你可能需要手动查找食材并下单。
现在,只需要把食谱和照片发给ChatGPT Operator,它能识别图片中的食材,并根据食谱自动为你下单。
2. 挑选周末旅行目的地
旅行规划是一个繁琐的过程,特别是当你需要根据预算、兴趣以及隐藏的旅游宝地来安排行程时。
ChatGPT Operator 通过在Reddit等社区收集信息,结合你的偏好,自动为你规划一个周末旅行路线。
甚至当网站对其进行屏蔽时,它竟然能通过其他搜索引擎找到解决方案,展示惊人的自主灵活性,着实让人惊讶。
3. 根据预算推荐家政服务
家政服务的预约往往涉及多个平台和大量信息比对。
ChatGPT Operator通过预先设置好的预算信息,能够为你筛选出多个符合要求的家政服务供应商,甚至能够提供详细的评价,帮助你做出选择。
这样,你可以省去自己反复查询和比较的时间。
4. 代为进行加密货币投资研究
加密货币的市场变化无常,选择哪个代币进行投资常常需要耗费大量的时间和精力。
但ChatGPT Operator 在这一点上竟然能展现出不容小觑的优势。
当需要了解哪些代币值得关注时,不仅能快速扫描相关的加密货币信息,还能绕过某些验证码,继续提供实用的分析。
这种“创新性的解决方案”,你不得不再次惊讶。
5. 从头到尾帮你完成机票预订
无论是预订一张机票,还是修改航班,ChatGPT Operator都能通过与Booking系统的整合,自动为你完成。
即使需要你确认航班信息或付款细节,它也能及时提醒,确保每个环节都顺利进行。
6. 从多个渠道比价并购买生日礼物
为了挑选一份合适的生日礼物,ChatGPT Operator 不仅能根据需求提供合理的建议,还能比较各大网站的价格。
虽然有些网站会设置限制,阻止其获取信息,但它依然能在其他网站上找到相关的商品,并且确保给我提供最划算的选择。
7. 健康保险:突破隐性信息障碍
当涉及到健康保险时,大多数保险公司并不会公开所有价格,往往需要预约才能获取完整的报价。
然而,ChatGPT Operator能通过博客、论坛等其他途径,为你提供相关的建议和引导。
直接突破信息壁垒,让你更轻松地做出决策。
智能体的进化
如果你对OpenAI的“Tasks”功能仅仅停留在一个“还行”的印象中,那么面对ChatGPT Operator这几个案例,你可能会感到一阵惊讶。

这一次,OpenAI将智能体的能力提升到了一个全新的层次,ChatGPT Operator不仅能够理解任务需求,它还可以主动执行,甚至解决复杂的情境。
从功能层面上看,ChatGPT Operator的主要目标是代替我们处理繁琐且重复性的任务。
比方说,假设你要订个晚餐、预订一趟机票,或者在各大电商平台上比价购买商品。

过去你可能需要自己亲自操作,但现在,ChatGPT Operator可以在你做其他事情时,独立完成这些任务,并且高效完成。
是什么让 ChatGPT Operator 如此强大呢?
ChatGPT Operator 背后的核心技术精妙无比,基于OpenAI的“计算机使用代理”(Computer-Using Agent,CUA)模型。

这一模型结合GPT-4的视觉处理能力和高级推理能力,使其能够像人类一样“观察”网页内容(例如通过屏幕截图)并通过模拟鼠标点击和键盘输入来完成任务,无需依赖特定的API接口。
这种自主性和适应性是ChatGPT Operator的一大优势,也是与 Claude Computer Use 的最大区别,这种能力在执行复杂任务时,表现得异常高效。

ChatGPT Operator 更像一个真正的智能体,能够适应各种网页和任务,而 Claude 则更多依赖于预设的指令或 API 接口。
此外,ChatGPT Operator 还具备智能化的决策与自纠正能力。
在执行任务时,如果遇到困难或错误,它能通过推理和分析当前情况做出调整。
例如,假如餐厅预定时间已满,它会主动询问用户是否改订其他时间,而不是直接失败。
当然,ChatGPT Operator 也非常注重用户的安全和隐私保护。
在执行涉及敏感信息的操作时(如支付信息),它会主动暂停任务并请求用户确认,从而确保用户信息的安全性。
局限和未来
不过,尽管ChatGPT Operator 在很多方面表现得非常出色,它也并非完美。
部分网站会检测到AI的存在并加以屏蔽,导致无法顺利操作。
另外,目前与ChatGPT Operator整合的合作伙伴数量有限,尚不能在所有领域广泛应用。
同时,它的任务执行输出较短,主要用于执行具体任务,而不像传统ChatGPT那样生成长篇文章或复杂的代码。

然而,这些局限性并不影响其巨大的发展潜力。
作为一款仍处于研究预览阶段的工具,ChatGPT Operator 正在不断迭代,未来有望带来更多突破。
2025年是智能体之年
目前,Operator 仅面向美国地区的 ChatGPT Pro 用户开放,订阅费用为 200 美元/月。
但这个预览版意义重大,要知道就连ChatGPT最初也是以研究预览的形式问世的。

Sam Altman 发布会直播中明确表示:“这款产品是我们进军智能体领域的开始。”
与此同时,OpenAI总裁兼联合创始人Greg Brockman(格雷格·布罗克曼)也在社交媒体上表示,2025年是智能体之年。
正如 AI 大神Karpath y所说:
“像ChatGPT Operator这样的AI智能体,将逐步实现高效自主的任务执行,像类人机器人在物理世界中的作用一样。
虽然这条路仍需要大量努力,但它应该能成功。
2025-2035年将是智能体的十年,未来你将像CEO一样,监控多个智能体共同完成长期任务,事情将变得异常有趣。”
未来的智能体时代已经来临,你准备好迎接了吗?
入口:operator.chatgpt.com
- End -
点这里👇 关注我,记得标星 ⭐
会第一时间收到推送哦~
感谢看到这里,觉得还不错,
就来个点赞、转发、小心心三连吧~
我们下次再见!🌟