社区
教程
Wiki
注册
登录
创作新主题
社区所有版块导航
Python
python开源
Django
Python
DjangoApp
pycharm
DATA
docker
Elasticsearch
分享
问与答
闲聊
招聘
翻译
创业
分享发现
分享创造
求职
区块链
支付之战
aigc
aigc
chatgpt
WEB开发
linux
MongoDB
Redis
DATABASE
NGINX
其他Web框架
web工具
zookeeper
tornado
NoSql
Bootstrap
js
peewee
Git
bottle
IE
MQ
Jquery
机器学习
机器学习算法
Python88.com
反馈
公告
社区推广
产品
短视频
印度
印度
一周十大热门主题
机器学习学术速递[1.30]
Positron入门,下载安装和运行Python、R语言代码,终于不用再来回折腾不同的IDE了
机器学习学术速递[2.2]
183亿算力大单落地、北京40家IDC启动绿色改造、中卫22亿总包,张家口44亿项目规划、泰掷380...
Docker方式安装你的私人AI电脑助手Moltbot
用 Python 揭秘“市场折叠”:一种全新的金融市场预测思路
GitHub 20k Star 项目被迫删库,B站这一刀彻底砍断了开放的梦
【域外资讯】EDPB和EDPS就欧盟委员会提出的“人工智能数字综合提案”(Digital Omnib...
七大赛道 TOP 10 公布!Gitee 年度开源项目评选结果正式揭晓
大学生AIGC作品,为你讲述青春校园故事
关注
Py学习
»
chatgpt
谷歌Gemini和ChatGPT谁更厉害
未尽研究
• 2 年前 • 242 次点击
谷歌宣布推出其“最通用、功能最强大”的新大型语言模型Gemini 1.0。
Gemini有三个版本:适用于高度复杂任务的Gemini Ultra、适用于各种任务的最佳模型Gemini Pro和适用于手机等端侧设备的Gemini Nano。
发布会上,谷歌DeepMind首席执行官、Gemini团队代表德米斯·哈萨比斯(Demis Hassabis)正面谈及GPT-4与Gemini的对比,“我们对系统进行了非常彻底的分析,并进行了基准测试。谷歌运行了32个完善的基准测试来比较这两个模型,从广泛的整体测试(如多任务语言理解基准测试)到比较两个模型生成Python代码的能力。”哈萨比斯表示,“我认为我们在32项基准中的30项中大幅领先。”
果真如此吗?
威斯康辛大学教授Dimitris Papailiopoulos尝试将Gemini发布时展示的14道原题输入ChatGPT,看两个大模型到底谁更厉害。
我们一起来看一看:
第1题:验证一名学生解答的物理题
结果:GPT-4的答案和Gemini一样
第2题:inverse图像,GPT-4没那么厉害,但也没差那么多(毕竟付出了努力,但读图能力真不咋样)
第3题:辨别植物、关注细节
结果:打成平手
第4题:接下来的图像是什么?
结果:打成平手
第5题:几何推理
结果:GPT-4理解了,打成平手
第6题:高尔夫球和月球的关系
结果:打成平手
第7题:识别照片中的地点。
结果:GPT-4一开始拒绝提供相关信息,因为它认为这是在泄露隐私,但最终还是提供了。
第8题:解释笑话
结果:我认为GPT-4在这方面的能力更强些
第9题:中文里,如何称呼祖父母?
结果:打成平手
第10题:创建一个关于“负鼠”的谷歌搜索页面
结果:GPT-4没有添加图像,但它添加了一个“放入你最喜欢的负鼠图片”文件夹。我认为两者打成平手。
第11题:解方程式
结果:GPT-4太差劲了。0分!
第12题:多步骤推理
结果:打成平手,GPT-4使用了数据编译,我不知道这是否公平。
第13题:
翻转Matplotlib 图表,并在变更后增加两个函数。
结果:GPT-4不是百分百正确,而且它处理图像真的不行,我能说打成平手吗?
第14题:图表理解和推理
结果:打成平手
14道题中,ChatGPT答对12题。
总结:在图像相关的处理上,Gemini略胜一筹;其他方面,两者旗鼓相当。
Python社区是高质量的Python/Django开发社区
本文地址:
http://www.python88.com/topic/165401
登录后回复