社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

被1977年的游戏机“血虐”90分钟?ChatGPT玩Atari象棋游戏,结果新手模式下都惨败

CSDN • 昨天 • 8 次点击  

图片

整理 | 郑丽媛
出品 | CSDN(ID:CSDNnews)

“今天你玩 Atari 了吗?ChatGPT 可能现在只想假装从没听说过这个名字。”——这是 Citrix 架构专家 Robert Jr. Caruso 在一篇 LinkedIn 帖文中的最后一句话。

故事的开头源于一个简单想法:拿最新的 AI 模型 GPT-4o 去对战 1979 年在 Atari 2600 家用游戏机上发布的一款象棋游戏 Video Chess,看看谁更强。而结局就如同开头所说:ChatGPT 被“复古 8 位游戏机”彻底打懵,在新手难度下都连败不止,最终只能“低头认输”。

AI 产品爆发,但你的痛点解决了吗?8.15-16 北京威斯汀·全球产品经理大 会 PM-Summit,3000+ AI 产品人社群已就位。
直面 AI 落地难题、拆解头部案例、对接精准资源!

扫码登记信息,添加小助手进群,抢占 AI 产品下一波红利:

进群后,您将有机会得到:
· 最新、最值得关注的 AI 产品资讯及大咖洞见
· 独家视频及文章解读 AGI 时代的产品方法论及实战经验
· 不定期赠送 AI 产品干货资料和秘籍



一场看似轻松的对局,变成了 ChatGPT 的“翻车现场”

上周末Caruso 在家中用 Stella 模拟器运行 Atari 2600 游戏机(1977年发布)上的经典游戏 Video Chess 并邀请基于 GPT-4o  ChatGPT 来对战。

相较于 ChatGPTVideo Chess 这款象棋游戏引擎几乎不能称为“智能”它运行在 1.19 MHz 的 MOS 6507 处理器上,最多只能预测一到两步棋,思考能力堪比人类初学者。

但出人意料的是:ChatGPT 在新手难度下居然连连败北,失误不断。LinkedIn 帖文中Caruso 指出 ChatGPT 表现之差堪称“小学三年级象棋社小围观嘲笑的水平”。

起初为了避免 ChatGPT “认不出棋子”Caruso 特地提供了标准的棋盘布局图,帮助它识别棋子。即便如此ChatGPT 还是把车当成象、漏掉了兵的夹击,还一再搞不清棋子的具体位置。甚至开始输的时候ChatGPT 自己的失利归咎于 Atari 棋子图标“太抽象、不好识别”,可后来换成标准棋谱之后,它的表现也没好到哪里去。

更“抓马”的是:在整场 90 分钟的对局过程中,Caruso 不得不频繁纠正 ChatGPT  的失误行为“别走这步”“你刚才的棋子已经被吃了”而 ChatGPT 则反复表示“我们从头再来一次,我一定能表现更好。”

最终它也不得不承认自己无力翻盘,只能承认失败,低下了“AI 高傲的头”。


深蓝到 ChatGPT:AI 与象棋的不解之缘

事实上象棋作为 AI 能力的测试标准,这并非新鲜做法

象棋是一种规则明确、状态空间庞大、对策略和计算要求极高的游戏,非常适合作为衡量算法性能与推理能力的标尺。因此在 AI 的发展历史中,象棋一直是一个颇有象征意义的试金石。

其中最为人熟知的历史时刻,莫过于 1997 年 IBM 的超级计算机“深蓝(Deep Blue)”以 胜 负 平的成绩,战胜了当时世界排名第一的国际象棋大师卡斯帕罗夫。这场胜利标志着 AI 第一次在复杂战略博弈上压倒人类,从而开启了计算智能走向实战化的新时代。

然而到了 2025 年,深蓝 ” 11.4 GFLOPS 的性能已远不如今天任何一款入门级处理器。按理说,如今 GPT-4o 这类大型语言模型在面对几十年前的低配游戏时,应该是“降维打击”——毕竟如果让人猜一个近半世纪前的 8 位游戏机能否击败当前最先进的 AI 模型,大多数人的答案恐怕都会是“不可能”。

但显然,AI 也有“盲区”。


为什么 ChatGPT 会输?语言模型≠棋力引擎

得知这样的结果不少人提出疑问一个能写代码、能写诗、能答题、甚至能分析人类心理的 AI,怎么会在一款低难度象棋游戏中频频出错?

关键在于:ChatGPT 并不是专门为下棋而训练的引擎,它是通用型的语言模型。

简单来说ChatGPT 的核心能力在于“预测下一个词”,它通过庞大的语料训练来建立语言、逻辑和常识之间的关联。虽然它也可以在文本环境下模拟一些游戏过程(包括象棋、围棋等),但并不具备专门用于游戏决策的搜索算法、博弈策略或状态树评估能力。

相比之下,即使 Video Chess 是 1979 发布游戏,也内置了最基础的穷举搜索和位置打分逻辑——尽管十分简单,但它至少知道“怎么在棋盘上活下去”。

这也是为什么许多专业象棋软件在围棋、象棋等领域表现远超通用 AI 模型——它们的“目标明确”,而不是像 ChatGPT一样“什么都能做一点,但什么都不专精”。从这个角度来看,ChatGPT 在 Atari 象棋游戏中的失败,也并非表示“AI 不行”,而是提醒我们:AI 不是 全能,它的表现高度依赖于任务适配性和输入清晰度。

推荐阅读:

史上最统一大改版!iOS、macOS等全员跳26,苹果全家桶开启“液态玻璃”新界面,Siri却意外缺席

因“过于痴迷”AI,50+岁程序员被公司开除:全靠Copilot写代码,还恐吓新人将被AI取代

AI 进化风向标,2025 全球产品经理大会首批议题曝光!

📢 2025 全球产品经理大会

8 月 15–16 日 

北京·威斯汀酒店

2025 全球产品经理大会将汇聚互联网大厂、AI 创业公司、ToB/ToC 实战一线的产品人,围绕产品设计、用户体验、增长运营、智能落地等核心议题,展开 12 大专题分享,洞察趋势、拆解路径、对话未来。

更多详情与报名,请扫码下方二维码。

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/183222
 
8 次点击