社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

感谢DeepSeek,ChatGPT开始公开o3思维链,有点open但不多!

Datawhale • 4 月前 • 144 次点击  

 Datawhale分享 

OpenAI:思维链,整理:Datawhale

信息来源|新智元
今天凌晨,OpenAI 为 ChatGPT 推出了一系列更新,其中一项重要改进是允许用户更深入地查看 o3-mini 和 o3-mini-high 模型的思维链内容。
比如问「怎么今天不是星期五啊😅」?
在展示出来的CoT中,o3-mini一步步思考,这个问题应该是用户在搞幽默,觉得本周应该快结束了,结果还没结束。因此,自己需要给一个聪明机智的回答。
然后它用Zeller公式计算后发现,2025年2月6日的确是星期四,即使闰年的特殊情况也是如此。
最终,它回答说:今天的确是周四不是周五,日历就是这么定的。然后提供了一番情绪价值,鼓励用户说:再忍忍,只差一天啦!
不过,机智的大神们很快就发现了「华点」——这是「真的CoT」吗?
没多久,就破案了!
先是OpenAI研究员Noam Brown发文表示,这次放出来的并不是模型原始的CoT。
随后,Tibor Blaho也发现——所谓的CoT,无非就是个「总结器」而已。(手动狗头)
对此,奥特曼解释道,我们正努力整理原始的CoT提升可读性,并在必要时提供翻译,尽量保持原始内容的忠实度。
他放出了四个emoji,让o3-mini在思维链中展示了一把推理过程

部分开放的原因

OpenAI这波植入CoT总结器的做法,着实是被DeepSeek R1强势崛起吓到了。

o3-mini发布当天,OpenAI在Reddit开启AMA在线问答中,网友曾提问,「我们能看到模型思考的所有token吗」?
当时,奥特曼回复道,「我们很快就会展示一个更有帮助、更详细的版本」。
仅仅在不到一周的今天,OpenAI就更新了。
但这次,OpenAI之所以选择展示总结版本,而不是完整的思维链,部分原因还是竞争。该公司表示其找到了一个平衡:o3-mini可以「自由思考」,然后将其「思维」组织成某个总结版本。
对此,OpenAI发言人表示,「为了提高清晰度和安全性,我们增加了一个额外的后处理步骤,其中模型审查原始思维链,移除任何不安全的内容,然后简化任何复杂的思想。」
「此外,这个后处理步骤使非英语用户能够以他们的母语接收思维链,创造一个更易于访问和友好的体验。」
参考资料:

https://x.com/btibor91/status/1887633671483760862

https://x.com/OpenAI/status/1887616278661112259

https://x.com/polynoamial/status/1887621287616651429


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/178812
 
144 次点击