OpenAI 正在推动 ChatGPT 向白领核心工作平台转型,并开发出一批“AI Agent”新功能,让用户在无需依赖微软 Office 应用的情况下,就能完成 Excel 表格和 PowerPoint 演示文稿的创建与编辑。
根据The Information报道,最新版本的 ChatGPT 已内置生成演示文稿和电子表格的功能按钮,用户可直接在聊天框下方点击按钮,生成与微软格式兼容的文件,而无需打开 PowerPoint 或 Excel。本质上,ChatGPT 开始成为一个办公入口,而非只是“提问答案机”。
虽然 OpenAI 尚未公布这些功能的具体上线时间,但这项进展意味着用户可以使用非微软的软件打开这些 .pptx 和 .xlsx 文件——因为微软早已将这些文件格式开源,OpenAI 并不需要获得许可。
更进一步,这些智能体还可以辅助用户基于企业或公开数据生成报告,或完成一些日常网站任务,比如日程安排、预约等重复性操作。整体来看,OpenAI 正在用一套“替代 Office 套件”的产品矩阵,逐步构建自己的生产力工具闭环,对微软和谷歌等办公软件巨头构成实质性威胁——尽管讽刺的是,ChatGPT 本身几乎完全运行在微软的服务器上。
OpenAI 希望把 ChatGPT 打造成用户完成工作和接入在线服务的“超级应用”。目前,ChatGPT 的用户已达数亿,其中包括数千万付费订阅者。不少企业员工已将其作为报告生成、文案修改、数据分析,甚至代码编写的日常工具。
所谓“AI Agent”,是指相比基础版 ChatGPT 更具主动性与流程掌控能力的智能程序,能够自动完成多步骤任务,无需人类逐步引导。据业内定义,目前已有大约七类不同类型的 AI Agent。
协作功能仍未上线,意图替代 Google Docs?
The Information 此前曾报道,OpenAI 已开发出多人协作的文档工具,可支持多名用户围绕某一文档进行实时对话与修改,但目前尚未上线。该功能一旦发布,将正面挑战 Google Workspace 和 Microsoft Office 的核心价值:多人实时协作。
不过,ChatGPT 目前仍存在明显短板。例如它缺乏像 Google Drive 或 OneDrive 那样的文件存储与文件夹管理系统,也不支持用户在多个文件间切换。
此外,知情人士表示,这些新推出的 Agent 在性能上仍不稳定:一个原本人类十几分钟能完成的表格任务,AI Agent 可能需要三十分钟甚至更久,且存在卡顿或中断问题。但从节省时间和“做杂事”的角度看,它依然可以视作“AI 实习生”的替代角色,对用户有实际帮助。
ChatGPT 已推出的 Deep Research 和 Operator 等智能体,已具备爬取网页和摘要提炼的能力。即将上线的 Reports Agent 则更进一步:它不仅能阅读网页内容,还能点击文章中的链接继续探索,甚至在数据库中进行搜索。
与现有 Operator 功能相比,新一代的 Actions Agent 还具备更强的容错性:在遭遇网站屏蔽等问题时,会尝试多种解决方案,不易“卡死”。
而表格与演示文稿智能体则是全新能力。用户只需输入自然语言指令,如:“基于公开财务数据,生成一份苹果公司的贴现现金流分析”,“制作一份展示台积电资本开支变化趋势的演示文稿”。
智能体将自动撰写代码,生成与 Excel 或 PowerPoint 完全兼容的文件,让复杂任务一键完成。
来源:
[1] https://www.theinformation.com/articles/openai-preps-chatgpt-agents-challenge-microsoft-excel-powerpoint?rc=o6xpry
投稿邮箱:zfinance2023@126.com稿件经采用可获邀进入Z Finance内部社群,优秀者将成为签约作者,00后更有机会成为Z Finance的早期共创成员。