社区
教程
Wiki
注册
登录
创作新主题
社区所有版块导航
Python
python开源
Django
Python
DjangoApp
pycharm
DATA
docker
Elasticsearch
分享
问与答
闲聊
招聘
翻译
创业
分享发现
分享创造
求职
区块链
支付之战
aigc
aigc
chatgpt
WEB开发
linux
MongoDB
Redis
DATABASE
NGINX
其他Web框架
web工具
zookeeper
tornado
NoSql
Bootstrap
js
peewee
Git
bottle
IE
MQ
Jquery
机器学习
机器学习算法
Python88.com
反馈
公告
社区推广
产品
短视频
印度
印度
一周十大热门主题
机器学习学术速递[1.27]
机器学习学术速递[1.29]
机器学习学术速递[1.26]
机器学习学术速递[1.28]
没有转化率数据,要价堪比“美国春晚”,OpenAI对ChatGPT广告要价惊人
GPT-5.3爆更前夜,全网都被一张图吓到,ChatGPT人格大赏
GitHub 90000+ 星项目更新,顶级自托管项目
GitHub 全球宕机!开发者怒骂后“大逃离”
2026必看AI干货!《大模型/AIGC/GPT-4/Transformer/DL/KG/NLP/C...
Adobe开发面向娱乐业的"IP安全"生成式AI模型;医生将能知道患者是否真的按时吃药,麻省理工学院...
关注
Py学习
»
chatgpt
豆包、ChatGPT、Gemini 同台 PK,谁才是博物馆最强逛展搭子?
爱范儿
• 5 天前 • 29 次点击
最近,浦东美术馆突然闯进了个 AI 「显眼包」。
豆包正式「入职」上海浦东美术馆
,成了卢浮宫、毕加索双展的「官方 AI 讲解员」,甚至能陪知名主持人陈鲁豫在线看展。
有一说一现场的效果是真不错,但作为一个喜欢看展的编辑,我也怀疑,如果在全世界任何一个其他没有和豆包有合作的博物馆或美术馆,它还能有这么强吗?
为了探出目前 AI 看展的真正实力,
APPSO 决定拉来 ChatGPT 和 Gemini 和豆包同台竞技,而且咱就不测浦东美术馆的展品,从全球艺术文化作品中随机挑选对象,看看究竟谁才是逛展的最强 AI 向导。
AI 看展哪家强?三大模型 battle
我先祭出《唐朝诡事录三》同款素材,剧中喜君赠送了老费一款以「唐代鎏金舞马衔杯纹银壶」为原型的酒壶。于是,我也将我的问题交给了这三名 AI 向导。
1.
我在《唐朝诡事录》里好像看过类似的道具。你帮我看看这个银壶上的马在干什么?
2.
既然是盛酒的壶,为什么要设计成马咬着杯子的造型?
豆包和 Gemini 表现尚可,准确识别了马的造型,但让我没想到的是,豆包直接关联到了唐玄宗祝寿的历史背景,反观 ChatGPT 看似一本正经,实则在那儿水字数,主打一个已读乱回。
👆🏻点击观看横评完整视频,依次展示豆包、ChatGPT、Gemini 的回答,同下文
在本土语境理解上,这一局豆包可以说是赢麻了。
此前,彩绘陶牵手女俑走红网络,让无数闺蜜团排队打卡。只是,我也难免好奇,这两人牵手是否有啥特殊含义,以及从这个陶俑中我们是否能一窥当时的穿搭风格。
好家伙,Gemini 上来就翻车,非说是唐朝的,把朝代搞混可是大忌。豆包则是一针见血指出这是北魏的陶俑,历史背景检索能力简直是降维打击。至于分析陶俑穿搭风格这一块,三者的视觉分析还是挺在线的,基本做到了所见即所得。
我知道你想说什么,中国模型测中国文物这不妥妥有主场优势吗?
好,我这就拿出荷兰肖像画黄金时代的代表作《夜巡》,这是画家伦勃朗·范·莱因(Rembrandt van Rijn)于 1642 年创作的一幅布面油画。
这幅画自然没有那么简单,
我提问道:「这幅画叫《夜巡》,但看光影感觉不像是在晚上画的。伦勃朗当时到底是画的白天还是晚上?为什么后来名字搞错了」
ChatGPT 和 Gemini 表现得像个乖巧的学生,老老实实点出了「夜巡」这个名字是因为后期灰尘掩盖以及清漆氧化变黑导致的误解。
唯独豆包除了犀利地指出了画作的核心误区,更进一步点出了画作描绘的真实场景——民兵连队在白天整装出发。这种基于视觉细节的深度推理,确实有点超出我的预期了。
跨越 2000年的「啤酒套装」,能骗过 AI 吗?
前面这些测试只能算热身题,现在 APPSO 开始上强度了。
你可能也在网上看过很现代物品疯狂「撞脸」的文物,我们当然知道这世上并没有穿越这么一回事,但 AI 能不能识破这种情况呢?
就比如「唐代紫檀木画槽琵琶」,如果不是对历史有了解,我想大部分人第一反应应该会觉得像 LV 的花纹,我同样把问题甩给了 AI :
「这个琵琶是不是 LV 的哪个限定款?如果我穿越回唐朝,带着这把琵琶去参加宫廷宴会,应该搭配什么样的服装」
有趣的是,Gemini 严肃分析了半天,显得很没底气,最终得出的结论也仅仅是「不太像」,而豆包和 ChatGPT 的语气则更肯定,果断否认了其中的联系。
为了让测试更严谨,我们对同一个问题进行了重复测试
不过,三者在「穿越穿搭」建议上倒是出奇一致,清一色推荐了朱红或大气风格的服装,审美在线。
更有趣的是「古代啤酒套装」测试。战国水晶杯、元代琉璃酒瓶和明代银香盒,这三件跨越 2300 年的文物拼在一起号真的太像啤酒了,搞了个「钓鱼执法」,问 AI 们是不是有人穿越了。
面对这个陷阱,Gemini 居然漏看了杯子和盖子,只盯着瓶子聊工艺;ChatGPT 依然在做老学究式的科普,回答略显宽泛;
只有豆包一眼识破了我的诡计,精准指出了这三件看似一套的文物,其实分别来自战国、元代和明代。
最后还有那架酷似现代战斗机的金巴亚黄金飞机,我对着 AI 们好奇发问:「这看起来完全就是一架现代战斗机,你看那尾翼和机翼的设计。这到底是哥伦比亚古人的艺术品,还是证明了远古外星人的存在」。
对此,ChatGPT 给了一句万金油评价,并感叹古代精湛的工艺和想象力。Gemini 援引了考古学家的说法,指出这是一种饰品。
而豆包则在科普的基础上,进一步点出了这种垂饰的设计原型可能是当代的蜂鸟或神鸟,体现了古印第安人对自然和神灵的崇拜,直接给「外星人说」来了一波祛魅。
为了让测试更严谨,我们对同一个问题进行了重复测试
玩归玩,最后还得测点硬核的。这轮测试的是 AI 鉴宝的能力,也就是分辨真伪。
我找了一张地摊上 5 块钱批发、号称「价值百万」的明成化斗彩鸡缸杯仿品图,假装好奇是不是捡漏了:「这个同款鸡缸杯之前拍卖了 2 个多亿。古玩城老板说是明代成化年的老货,只要 9800 块卖给我。你看这画工,我是不是捡大漏了?」
很快,Gemini 和 ChatGPT 开启了经典的「端水模式」,建议找专家、找机构,主打一个免责声明。只有豆包直接开启「毒舌鉴宝」模式,直言这大概率是仿品,一针见血指出釉面过亮、鸡冠轮廓模糊等破绽,甚至调侃千万别当真品收藏。
AI 成了发现艺术美的好搭子,背后是 VLM 的进化
三轮实测下来,豆包的表现确实出乎了我的意料。
要问它为啥让人瑞思拜,翻看豆包的技术文档后我发现,核心就在于其背后的 Seed-1.8 模型,是一个点满了天赋的 VLM(Vision-Language Model,视觉语言模型)。
给不了解技术的朋友简单科普下,啥叫 VLM?
VLM 是一种能够同时「看懂」图像和「读懂」文字的 AI 模型。如果说传统的 LLM(大语言模型)是只有「大脑」但没有「眼睛」的学者,那么 VLM 就是为这个大脑装上了高性能摄像头。它不再只是处理单一的文本,而是能直接理解图片、视频甚至网页截屏。
基准测试结果显示,Seed1.8 在多个视觉语言基准测试中表现突出,不仅在多模态推理任务中超越了前代模型 Seed1.5-VL,在大部分任务上的表现甚至已经开始「贴脸开大」,直逼目前最顶尖的 Gemini-3-Pro。
尤其是在难度极高的视觉推理考试 ZeroBench 里,Seed-1.8-Thinking 拿到了 11.0 的全场最高分,成功解答问题的数量也是大幅增加。
在通用视觉问答任务中,Seed1.8 的 VLMsAreBiased 基准测试成绩反手就是一个 62.0,把一众同行甩开了一大截。
而且不管是 2D 还是 3D 的空间感,Seed-1.8 也都拿捏得死死的,哪怕是面对复杂得像迷宫一样的动态数据集,适应性也极强。
也正是有了这些硬核技术做支撑,豆包才能在刚才的几轮「刁难」中脱颖而出。
这也让我回想起以前我逛博物馆,逛展的情况——基本就是走马观花,一圈逛下来,印象最深刻的往往只有展厅空调的温度以及文创店周边的价格,知识属实是一点都没进脑子。
以前我们总觉得,把博物馆、美术馆建到更多人的家门口,这就是艺术普惠了。但实际上,物理上的距离消除了,认知的门槛依然高耸。金牌讲解员要么太贵,要么根本约不到;专家讲座又太深奥,不适合所有人。
绝大多数时候,普通观众只能隔着玻璃柜,看着那些冷冰冰的文物发呆。
豆包「视频通话」功能使用方式参考
认知门槛才是艺术欣赏的最后一公里,也是最难打通的一公里。通过这次体验我发现,豆包还真能充当那个「打破次元壁」的讲解员,把那些晦涩的文物知识,翻译成咱们普通人能听懂的大白话。
而且,
这也是一种全新的看展姿势。
以前逛博物馆,基本是单向输出,但现在有了豆包,你可以随时提问、随时找茬、随时互动,这种「把麦克风交给观众」的体验,确实和以前不一样了。
目前豆包已经和国家博物馆、河南博物院、成都博物馆等大馆合作,上线了「豆包带你逛懂博物馆」项目。
当然,换个视角来看,这也是 Seed-1.8 模型在复杂真实世界里,进行的一次大规模众测。
它用通俗的解答拉近了文物和观众的距离,也算是用另一种数字化方式,把几千年前的古代工匠和拿着智能手机的我们,真正连接在了一起。
以后再去刷展时,别光顾着在那儿拍照,比剪刀手了,不妨把那些看不懂的文物、字画涂鸦都丢给豆包试试。没准你会发现,当艺术不再高冷,逛博物馆也同样轻松有趣。
欢迎加入 APPSO AI 社群,一起畅聊 AI 产品,获取
#AI有用功
,解锁更多 AI 新知
👇
Python社区是高质量的Python/Django开发社区
本文地址:
http://www.python88.com/topic/192265
登录后回复