社区
教程
Wiki
注册
登录
创作新主题
社区所有版块导航
Python
python开源
Django
Python
DjangoApp
pycharm
DATA
docker
Elasticsearch
分享
问与答
闲聊
招聘
翻译
创业
分享发现
分享创造
求职
区块链
支付之战
aigc
aigc
chatgpt
WEB开发
linux
MongoDB
Redis
DATABASE
NGINX
其他Web框架
web工具
zookeeper
tornado
NoSql
Bootstrap
js
peewee
Git
bottle
IE
MQ
Jquery
机器学习
机器学习算法
Python88.com
反馈
公告
社区推广
产品
短视频
印度
印度
一周十大热门主题
【2025版附安装包】超详细Python+Pycharm安装保姆级教程,永久免费使用,Python环...
老公和ChatGPT聊出精神病,她光速离婚
AI「自我复制」能力曝光!RepliBench警示:大模型正在学会伪造身份;o3一张图锁定地球表面坐...
2025 Q1 AI 产品流量报告:国外 ChatGPT 霸榜,国内教育 AI 破局
复旦大学提出GenPTW!AIGC水印技术新标杆!
张伯礼等6大院士共识,中医药+AI,大有可为!浙江中医药大学“网络药理学+机器学习+分子对接”,堪称...
【Python】拿来即用!9 个科研论文配图完整代码
6年年化收益46%,最大回撤率为16%的策略(附python代码)
免费插件 |QGIS深度学习实现语义分割、目标检测、超分辨率重建,直接提取建筑道路农田飞机等地物
dock2exe,将docker image转成exe可执行文件-20250508122233
关注
Py学习
»
chatgpt
谷歌Gemini和ChatGPT谁更厉害
未尽研究
• 1 年前 • 169 次点击
谷歌宣布推出其“最通用、功能最强大”的新大型语言模型Gemini 1.0。
Gemini有三个版本:适用于高度复杂任务的Gemini Ultra、适用于各种任务的最佳模型Gemini Pro和适用于手机等端侧设备的Gemini Nano。
发布会上,谷歌DeepMind首席执行官、Gemini团队代表德米斯·哈萨比斯(Demis Hassabis)正面谈及GPT-4与Gemini的对比,“我们对系统进行了非常彻底的分析,并进行了基准测试。谷歌运行了32个完善的基准测试来比较这两个模型,从广泛的整体测试(如多任务语言理解基准测试)到比较两个模型生成Python代码的能力。”哈萨比斯表示,“我认为我们在32项基准中的30项中大幅领先。”
果真如此吗?
威斯康辛大学教授Dimitris Papailiopoulos尝试将Gemini发布时展示的14道原题输入ChatGPT,看两个大模型到底谁更厉害。
我们一起来看一看:
第1题:验证一名学生解答的物理题
结果:GPT-4的答案和Gemini一样
第2题:inverse图像,GPT-4没那么厉害,但也没差那么多(毕竟付出了努力,但读图能力真不咋样)
第3题:辨别植物、关注细节
结果:打成平手
第4题:接下来的图像是什么?
结果:打成平手
第5题:几何推理
结果:GPT-4理解了,打成平手
第6题:高尔夫球和月球的关系
结果:打成平手
第7题:识别照片中的地点。
结果:GPT-4一开始拒绝提供相关信息,因为它认为这是在泄露隐私,但最终还是提供了。
第8题:解释笑话
结果:我认为GPT-4在这方面的能力更强些
第9题:中文里,如何称呼祖父母?
结果:打成平手
第10题:创建一个关于“负鼠”的谷歌搜索页面
结果:GPT-4没有添加图像,但它添加了一个“放入你最喜欢的负鼠图片”文件夹。我认为两者打成平手。
第11题:解方程式
结果:GPT-4太差劲了。0分!
第12题:多步骤推理
结果:打成平手,GPT-4使用了数据编译,我不知道这是否公平。
第13题:
翻转Matplotlib 图表,并在变更后增加两个函数。
结果:GPT-4不是百分百正确,而且它处理图像真的不行,我能说打成平手吗?
第14题:图表理解和推理
结果:打成平手
14道题中,ChatGPT答对12题。
总结:在图像相关的处理上,Gemini略胜一筹;其他方面,两者旗鼓相当。
Python社区是高质量的Python/Django开发社区
本文地址:
http://www.python88.com/topic/165401
169 次点击
登录后回复