【导读】太突然了!OpenAI深夜甩出GPT-5.5 Instant,全面接管ChatGPT默认模型。幻觉暴降52%、数学从65分飙到81分、回复字数直砍三成,更关键的是它开始记住你、看穿你的偏好。所有人免费薅羊毛。
今天,GPT‑5.5 Instant正式上线,所有人在ChatGPT中免费用!
它一共有三大亮点:回答更简洁、记忆更强、更加个性化。
GPT‑5.5 Instant取代GPT‑5.3 Instant,成为ChatGPT「默认模型」
在处理日常任务中,比起上一代,GPT-5.5 Instant更加强大。
无论是分析上传的图片、解答STEM难题,还是精准判断何时该调用网页搜索,它都游刃有余。
在幻觉率上,GPT‑5.5 Instant暴降52.5%,特别是在医疗、法律和金融等对严谨性要求极高的领域。
不仅如此,GPT-5.5 Instant还升级了记忆和个性化功能。
在记忆来源中,可以一键查找以往上下文,聊天时更加懂你,更具人情味儿。
奥特曼和总裁Greg在线力推GPT-5.5 Instant。
OpenAI给GPT-5.5 Instant的首要定位:更聪明。
在全方位基准测试中,5.5 Instant成绩单非常亮眼:
数学AIME 2025:从65.4%跳到81.2%;
博士级科学题GPQA:从78.5%升到85.6%;
多模态推理MMMU-Pro:从69.2%拉到76.0%。
内部评估显示,在涉及医学、法律、金融等高风险领域的提示词上,GPT-5.5 Instant产生的幻觉比5.3 Instant减少了52.5%。
上一代5.3 Instant发布时,幻觉改善幅度大约在20%出头,这次直接翻了一倍多。
在用户主动标记为「事实错误」的高难度对话中,不准确的陈述也减少了37.3%。
比如在下面这个实测中,GPT-5.5 Instant回答更优,因为它及时纠正了自己一开始的错误:
虽然最开始附和了那个错的答案,但随后自己发现,要是把x=3代回原方程根本就不成立。
并且找出了真正的计算错误(也就是用户移项弄错了),然后用求根公式算出了正确的解。
GPT-5.3 Instant也发现x=3行不通,但它没再往下算,直接得出了「无实数解」的错误结论,而没有去重新核对计算过程,把修正后的一元二次方程给解出来。
在OpenAI医学基准测试OmniDocBench中,5.5 Instant幻觉率下降了2.1%。
跑分之外,更多用户会立刻感受到的变化是,ChatGPT话少了。
OpenAI官方数据,GPT-5.5 Instant的回复字数比前代减少了30.2%,行数减少了29.2%。
比如,同样是问「怎么跟同事说别老唠叨」,5.3 Instant洋洋洒洒列了五种策略、三条注意事项、还贴心地问你「同事是什么性格」。
5.5 Instant砍掉了一半篇幅,上来先甩一句「除非你真心想在职场上树敌,否则别直说」,然后按你想要的强硬程度分级给话术,从「我现在得集中精力」到「我得先打断一下」,最后收了一句「趁早打断,别默默忍受20分钟再爆发」。
语气拿捏得很准,随性、实用、不过度。
此外,OpenAI还专门点名了一个问题,「无意义的表情符号」。
之前的ChatGPT废话太多、emoji乱飞、格式过度,现在终于知道收着点了。
换句话说就是,GPT-5.5 Instant搞清楚了什么时候该给长答案、什么时候用户只是想要一句干脆的回复。
对每天打开ChatGPT几