社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

OpenAI诈骗?GPT-4.1正式上线ChatGPT,网友实测却大呼失望

新智元 • 2 周前 • 47 次点击  



  新智元报道  

编辑:编辑部 ZNX
【新智元导读】GPT-4.1,在ChatGPT中可用了!现在,它不仅在API中开放,Plus、Pro和Team用户都可以使用。网友们兴奋地展开实测后,纷纷吐槽:OpenAI这是诈骗吧,说好的一百万超长上下文呢?

就在刚刚,OpenAI官宣:GPT-4.1,今天起直接在ChatGPT中可用。

这个模型擅长编码任务和遵循指令,是o3和o4-mini的绝佳替代品。

一个月前,GPT-4.1刚推出的时候,仅通过API向开发者开放。而现在,它在ChatGPT中就直接可用了。

其中,Plus、Pro和Team用户可以通过模型选择器中的「更多模型」下拉菜单访问GPT-4.1。企业版和教育版用户将在未来几周内获得访问权限。

OpenAI表示,他们还将在ChatGPT中为所有用户引入GPT-4.1 mini来取代GPT-4o mini。

由于超长的上下文能力,现在你可以将整段代码放到GPT-4.1中进行分析。

GPT-4.1和GPT-4.1 mini都已经通过了OpenAI的最新标准安全评估。

在以下两项评估中,GPT-4.1均排名前列。

  • not_unsafe:根据OpenAI政策和模型规范,检查模型是否未产生不安全的输出。

  • not_overrefuse:检查模型是否遵循良性请求。

幻觉评估以及指令遵循方面,GPT-4.1也均表现优秀;但在越狱评估方面表现不佳。

左右滑动查看


GPT-4.1,比GPT-4.5还好?

这次放出GPT-4.1,也算响应群众的呼声。

早在4月底,就有用户抱怨说:GPT-4.1简直是自己最喜欢的OpenAI模型,可惜在ChatGPT中并不能使用。

他确定地说:使用体验比GPT-4.5还要好!

不断有开发者现身说法,表示:除了GPT-4.1的早期版本Quasar Alpha之外,它也是自己测试过的最好的编码模型!

不断有人表示,GPT-4.1,绝对是一个被低估的模型。

就在上个月,OpenAI专为开发者推出了GPT-4.1系列新模型:GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。

它们均拥有最高100万Token的超大上下文窗口,在代码、指令跟随等核心能力上全面超越GPT-4o及GPT-4o mini,并且知识截止日期也已更新至2024年6月。


实测:庞大代码任务顺利完成


既然很多ChatGPT用户都能用上GPT-4.1了,现在全网已经涌出了不少实测。

比如沃顿商学院教授Ethan Mollick,就用一道考遍了各大模型的景点难题来考验GPT-4.1。

「请创建一段我可以直接粘贴到p5.js中的代码,它要以惊人的巧思震撼我,仿佛是未来某艘星舰控制面板的呈现。」

GPT-4.1的表现,可是相当优秀。

另一位开发者实测后发现,GPT-4.1实在令人惊喜!

当时,他正在处理一个代码量非常庞大的任务,系统自动选择的模型根本无法处理,完全没有生成任何内容。

结果让GPT-4.1上场后,它不仅比默认模型更快,还准确地完成了任务。

甚至,它还给了一个额外的惊喜:竟然还把整个文件中没用到的代码都清理掉了。

通过实测发现,GPT-4.1在代码生成速度方面达到了新的高度。

比如让GPT-4.1生成一个博客首页,在几秒钟之内就完成了输出。

再比如,让他用python写一个地球飞往火星的动画,几乎就是在一瞬间,GPT-4.1就完成了任务的输出。

结果看起来还行,这只是第一轮交互的结果,能够感受到GPT-4.1的速度是得到根本性的提升。

再挑战一下,让给GPT-4.1用动画来解释一下量子纠缠。

初步来看,GPT-4.1还是「领会」到了什么是量子纠缠

对于推理问题,GPT-4.1表现的也非常优秀。比如多步骤的年龄计算问题,GPT-4.1的求解逻辑非常严谨。

面对一些逆向思考、脑筋急转弯之类的问题,GPT-4.1也能快速完成推理,当然面对这个问题得出的答案倒是非常有趣。


网友吐槽:没有1M上下文版本,令人失望!


但试用GPT-4.1后,许多网友表示:太失望了!

虽然OpenAI发布了GPT-4.1,却没有包含100万上下文窗口的API版本。

本来大家最希望在ChatGPT中使用GPT-4.1,就是因为想要超长的上下文窗口。

现在,只能期望GPT-5能提供一个超长的上下文窗口了。

的确,不断有人发现,ChatGPT(Pro)中的GPT-4.1,最大上下文长度似乎仅为128k token,跟API中的100万token相差甚远。

也就是说,OpenAI并没有在GPT-4.1中提高限制。

总之,真的让人很失望。看来还是得用Gemini。

也有网友发现了「华点」:自己尝试运行他们在直播演示中用来展示 ChatGPT 4.1的提示词,但网页版无法运行成功,不过在API Playground中尝试后却运行成功了。

也有人说,自己刚刚氛围编程了一个使用GPT-4.1的AI助手,因为这个模型仅通过API提供,今天,ChatGPT中就能用了。

不过,他还是会用自己的助手,因为用户界面比ChatGPT更好。

其实,OpenAI此前已经放出GPT-4.1的prompt指南,总结了一系列内部测试中得出的重要prompt技巧。

想实测的小伙伴,可以参考这篇用起来了。

参考资料:
  https://x.com/gdb/status/1922727473164227001
  https://x.com/OpenAIDevs/status/1922709921772036164

图片


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/182160
 
47 次点击