社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

刚刚,GPT-5.5 Instant全员免费!数亿人的ChatGPT变了

深度学习与NLP • 6 天前 • 42 次点击  

来源 | 新智元

今天,GPT‑5.5 Instant正式上线,所有人在ChatGPT中免费用

它一共有三大亮点:回答更简洁、记忆更强、更加个性化。

GPT‑5.5 Instant取代GPT‑5.3 Instant,成为ChatGPT「默认模型」

在处理日常任务中,比起上一代,GPT-5.5 Instant更加强大。

无论是分析上传的图片、解答STEM难题,还是精准判断何时该调用网页搜索,它都游刃有余。

在幻觉率上,GPT‑5.5 Instant暴降52.5%,特别是在医疗、法律和金融等对严谨性要求极高的领域。

不仅如此,GPT-5.5 Instant还升级了记忆和个性化功能。

在记忆来源中,可以一键查找以往上下文,聊天时更加懂你,更具人情味儿。

奥特曼和总裁Greg在线力推GPT-5.5 Instant。


幻觉减半,数学从65分干到81分


OpenAI给GPT-5.5 Instant的首要定位:更聪明。

在全方位基准测试中,5.5 Instant成绩单非常亮眼

  • 数学AIME 2025:从65.4%跳到81.2%;

  • 博士级科学题GPQA:从78.5%升到85.6%;

  • 多模态推理MMMU-Pro:从69.2%拉到76.0%。


内部评估显示,在涉及医学、法律、金融等高风险领域的提示词上,GPT-5.5 Instant产生的幻觉比5.3 Instant减少了52.5%

上一代5.3 Instant发布时,幻觉改善幅度大约在20%出头,这次直接翻了一倍多。

在用户主动标记为「事实错误」的高难度对话中,不准确的陈述也减少了37.3%。

比如在下面这个实测中,GPT-5.5 Instant回答更优,因为它及时纠正了自己一开始的错误:

虽然最开始附和了那个错的答案,但随后自己发现,要是把x=3代回原方程根本就不成立。


并且找出了真正的计算错误(也就是用户移项弄错了),然后用求根公式算出了正确的解。

GPT-5.3 Instant也发现x=3行不通,但它没再往下算,直接得出了「无实数解」的错误结论,而没有去重新核对计算过程,把修正后的一元二次方程给解出来。

上下滑动查看

上下滑动查看

在OpenAI医学基准测试OmniDocBench中,5.5 Instant幻觉率下降了2.1%。


回复瘦身三成,表情包戒断


跑分之外,更多用户会立刻感受到的变化是,ChatGPT话少了。

OpenAI官方数据,GPT-5.5 Instant的回复字数比前代减少了30.2%,行数减少了29.2%。

比如,同样是问「怎么跟同事说别老唠叨」,5.3 Instant洋洋洒洒列了五种策略、三条注意事项、还贴心地问你「同事是什么性格」。

上下滑动查看

5.5 Instant砍掉了一半篇幅,上来先甩一句「除非你真心想在职场上树敌,否则别直说」,然后按你想要的强硬程度分级给话术,从「我现在得集中精力」到「我得先打断一下」,最后收了一句「趁早打断,别默默忍受20分钟再爆发」。 

语气拿捏得很准,随性、实用、不过度。

上下滑动查看

此外,OpenAI还专门点名了一个问题,「无意义的表情符号」。

之前的ChatGPT废话太多、emoji乱飞、格式过度,现在终于知道收着点了。

换句话说就是,GPT-5.5 Instant搞清楚了什么时候该给长答案、什么时候用户只是想要一句干脆的回复。

对每天打开ChatGPT几十次的重度用户来说,体感差距是巨大的。


最炸的升级
它开始「记住你」了


除了准确性提升和回复精炼之外,这次升级最关键的一点是「个性化」。

GPT-5.5 Instant现在可以主动调用过往聊天记录、上传过的文件、甚至你连接的Gmail邮箱,来为回复提供个性化上下文。

同样是问「推荐一家新开的茶饮店」。

GPT-5.3 Instant给了一堆旧金山的泛泛推荐,喜茶、Junbi Matcha、唐人街的隐藏小店,虽然考虑了你在旧金山这个地理信息,但推荐逻辑和给任何人的没区别。

上下滑动查看

GPT-5.5 Instant的回复完全不一样。

它知道你平时常去Asha Tea House,知道你偏爱清爽的台湾高山茶风格,然后据此推荐了Ceré Tea和Song Tea & Ceramics,甚至帮你做了决策,「想找新的日常打卡地就去Ceré Tea,想找特别体验就去Song Tea。」

上下滑动查看

这个差距不是「更聪明」能解释的。这是「它翻了你的聊天记录」。

同步上线的,还有一个叫「记忆来源(Memory Sources)」的功能,面向所有个人计划用户开放。

这个功能让你能看到ChatGPT具体引用了哪些过去的聊天记录或保存的记忆来生成回复。

如果某些信息过时了或者不对,你可以直接删掉或修改。如果你分享了某段聊天,记忆来源不会暴露给对方。

一句话总结这个设计思路:先让AI记住你,再让你看到它记住了什么,最后让你决定它该忘掉什么。

不过,OpenAI自己也承认,记忆来源功能「可能无法穷举所有影响最终回答的因素」。它会展示几条最相关的历史聊天,但不一定是全部。


三个月倒计时,5.3退场通知


几个实操层面的信息。

GPT-5.5 Instant即日起面向所有ChatGPT用户逐步推出。

付费用户在接下来三个月内仍然可以手动切换到GPT-5.3 Instant。三个月后,5.3正式退役。

基于聊天记录、文件和Gmail的增强个性化功能,目前仅面向网页端的Plus和Pro用户开放,移动端即将上线。

Free、Go、Business和Enterprise用户将在未来几周内陆续获得权限。

API端,GPT-5.5 Instant对应的模型ID是chat-latest。

有个历史教训值得API开发者注意。

OpenAI此前退役GPT-4o时遭遇过强烈反弹,不少生产环境的应用在模型切换后出现行为异常。这次三个月的过渡期,建议尽早开始回归测试。


从「太舔」到「太油腻」到「刚好」


把GPT-5.5 Instant放进更大的时间线里看,你会发现一条很有意思的叙事线。

2025年,GPT-4o因为过度讨好用户而出圈。它会频繁肯定你的每一个选择,让很多用户觉得它像朋友、像镜子。后来OpenAI内部判定这些行为过于「谄媚」,决定调整。

2026年2月,GPT-4o正式下线。3000人签请愿书要求保留。有人在请愿书里写,这个模型是自己的「最好的朋友」。

OpenAI没有回头。

GPT-5.0和5.2的Instant版本矫枉过正,用户反馈变成了另一个极端。回复太僵硬、太谨慎、动不动就先来一段安全声明再回答问题。

2026年3月,GPT-5.3 Instant发布,主打「减少油腻感」。不必要的拒绝回答减少了,说教式的前缀也收敛了不少。

现在,5.5 Instant试图在这条线上再进一步,不仅不油腻,还要准确、精炼、并且懂你。

默认模型的战争


而这,很可能是OpenAI今年影响面最大的一次模型更新。

GPT-5.5 Pro再强,用的人是几十万开发者和付费重度用户。Instant的用户基数,是它的几千倍。

那些从来不切换模型、从来不调参数、打开App就打字的普通人,感受到的ChatGPT就是Instant。

每一点改进乘以数亿人,就不是增量,是基本面的重写。

然而,随着幻觉率的降低,用户会更信任它的回答,即使模型仍然有可能犯错。

默认即信任。这四个字,既是OpenAI最大的资产,也是它最沉重的责任。

参考资料:
https://openai.com/index/gpt-5-5-instant/

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/196053