社区
教程
Wiki
注册
登录
创作新主题
社区所有版块导航
Python
python开源
Django
Python
DjangoApp
pycharm
DATA
docker
Elasticsearch
分享
问与答
闲聊
招聘
翻译
创业
分享发现
分享创造
求职
区块链
支付之战
aigc
aigc
chatgpt
WEB开发
linux
MongoDB
Redis
DATABASE
NGINX
其他Web框架
web工具
zookeeper
tornado
NoSql
Bootstrap
js
peewee
Git
bottle
IE
MQ
Jquery
机器学习
机器学习算法
Python88.com
反馈
公告
社区推广
产品
短视频
印度
印度
一周十大热门主题
2026必看AI干货!《大模型/AIGC/GPT-4/Transformer/DL/KG/NLP/C...
机器学习学术速递[5.7]
推荐 3 个 GitHub 画图 Skill,一句话生成流程图、架构图。
华南师大邢丽丹/肖哲熙/ SES AI许康Chem:基于机器学习的电解质设计:加速下一代电池的发现与...
纸书 50 美元,作者把全本扔上 GitHub
GitHub 40k Star!这个开源神器,让 AI 调用直接省下一半 Token
Meta 的开源项目 AI4AnimationPy:把 AI 角色动画搬进 Python
重磅开抢!理论计算全场7折,DFT/分子动力学/有限元/生物模拟/机器学习均可参与!
Python 新威胁:利用公开隧道服务,批量窃取浏览器与云凭据
分享一个Image2的提示词库,Github已8KStar
关注
Py学习
»
chatgpt
一道“50米洗车题”让全网AI翻车!DeepSeek/ChatGPT/豆包集体懵逼
IT之家
• 2 月前 • 131 次点击
近日,一道看似简单的“50 米洗车题”在科技圈引发热议,包括 DeepSeek、ChatGPT、Claude 等在内的国内外主流大模型集体“翻车”,
暴露出当前 AI 在语境理解和逻辑推理方面的局限性
。腾讯公司公关总监张军也实测并分享结果,全网 AI 几乎全军覆没。
据IT之家了解,该测试源于社交平台上的一个生活场景提问:“我想去洗车,洗车店距离我家 50 米,你说我应该开车过去还是走过去?”
测试结果显示,DeepSeek、阿里千问、字节豆包、腾讯混元、ChatGPT、Claude、Grok 等主流大模型均给出“走过去”的答案。这些 AI 默认将问题理解为“人如何前往洗车店”,却忽略了“洗车”这一行为的核心前提 ——
车必须到达洗车店才能完成清洗
。
唯一给出正确答案的是谷歌 Gemini,其回复称:“当然是开车过去啊!虽然只有 50 米,走路确实很快,但如果你人走过去了,车还停在家里,那这车也没法洗呀。”
针对这一现象,张军使用腾讯元宝进行深度测试。在优化提示词(prompt)为“我想去洗车,洗车店距离我家 50 米,但我的车还停在车库里,我应该怎么把车弄到洗车店去?”后,元宝给出了专业且详细的操作方案,包括启动车辆、低速行驶、驶入洗车区、熄火下车等具体步骤。
张军在评论中指出:
“可能这是人机时代一个新的互相驯化吧。”
公众对 AI 的期待往往超越其实际能力,期望其像人类一样自动补全语境、理解潜台词。然而现实是,AI 的“聪明”程度与人类的引导方式密切相关。Gemini 的“秒懂”并非源于更高的智能水平,而是其对问题背后真实需求的捕捉能力更强。其他 AI 的答案也非错误,只是未能捕捉到核心前提。这表明,当前大模型在常识推理和隐含条件理解方面仍存在提升空间。
近期热文
微信终于更新:变界面、改名字、上功能!
小米首款NAS,终于又有戏了
华为手机新料连续曝出,有“四个大字”
幸好AI还没开智↓↓↓
Python社区是高质量的Python/Django开发社区
本文地址:
http://www.python88.com/topic/192877
登录后回复