社区教程 Wiki

注册登录

创作新主题

社区所有版块导航

Python

python开源 Django Python DjangoApp pycharm

DATA

docker Elasticsearch

分享

问与答闲聊招聘翻译创业分享发现分享创造求职区块链支付之战

aigc

aigc chatgpt

WEB开发

linux MongoDB Redis DATABASE NGINX 其他Web框架 web工具 zookeeper tornado NoSql Bootstrap js peewee Git bottle IE MQ Jquery

机器学习

机器学习算法

Python88.com

反馈公告社区推广

产品

短视频

印度

印度

一周十大热门主题

机器学习学术速递[1.30]

Positron入门，下载安装和运行Python、R语言代码，终于不用再来回折腾不同的IDE了

机器学习学术速递[2.2]

183亿算力大单落地、北京40家IDC启动绿色改造、中卫22亿总包，张家口44亿项目规划、泰掷380...

Docker方式安装你的私人AI电脑助手Moltbot

用 Python 揭秘“市场折叠”：一种全新的金融市场预测思路

GitHub 20k Star 项目被迫删库，B站这一刀彻底砍断了开放的梦

【域外资讯】EDPB和EDPS就欧盟委员会提出的“人工智能数字综合提案”（Digital Omnib...

七大赛道 TOP 10 公布！Gitee 年度开源项目评选结果正式揭晓

大学生AIGC作品，为你讲述青春校园故事

关注

Py学习 » chatgpt

谷歌Gemini和ChatGPT谁更厉害

未尽研究 • 2 年前 • 242 次点击

谷歌宣布推出其“最通用、功能最强大”的新大型语言模型Gemini 1.0。

Gemini有三个版本：适用于高度复杂任务的Gemini Ultra、适用于各种任务的最佳模型Gemini Pro和适用于手机等端侧设备的Gemini Nano。

发布会上，谷歌DeepMind首席执行官、Gemini团队代表德米斯·哈萨比斯（Demis Hassabis）正面谈及GPT-4与Gemini的对比，“我们对系统进行了非常彻底的分析，并进行了基准测试。谷歌运行了32个完善的基准测试来比较这两个模型，从广泛的整体测试（如多任务语言理解基准测试）到比较两个模型生成Python代码的能力。”哈萨比斯表示，“我认为我们在32项基准中的30项中大幅领先。”

果真如此吗？

威斯康辛大学教授Dimitris Papailiopoulos尝试将Gemini发布时展示的14道原题输入ChatGPT，看两个大模型到底谁更厉害。

我们一起来看一看：

第1题：验证一名学生解答的物理题

结果：GPT-4的答案和Gemini一样

第2题：inverse图像，GPT-4没那么厉害，但也没差那么多（毕竟付出了努力，但读图能力真不咋样）

第3题：辨别植物、关注细节

结果：打成平手

第4题：接下来的图像是什么？

结果：打成平手

第5题：几何推理

结果：GPT-4理解了，打成平手

第6题：高尔夫球和月球的关系

结果：打成平手

第7题：识别照片中的地点。

结果：GPT-4一开始拒绝提供相关信息，因为它认为这是在泄露隐私，但最终还是提供了。

第8题：解释笑话

结果：我认为GPT-4在这方面的能力更强些

第9题：中文里，如何称呼祖父母？

结果：打成平手

第10题：创建一个关于“负鼠”的谷歌搜索页面

结果：GPT-4没有添加图像，但它添加了一个“放入你最喜欢的负鼠图片”文件夹。我认为两者打成平手。

第11题：解方程式

结果：GPT-4太差劲了。0分！

第12题：多步骤推理

结果：打成平手，GPT-4使用了数据编译，我不知道这是否公平。

第13题：

翻转Matplotlib 图表，并在变更后增加两个函数。

结果：GPT-4不是百分百正确，而且它处理图像真的不行，我能说打成平手吗？

第14题：图表理解和推理

结果：打成平手

14道题中，ChatGPT答对12题。

总结：在图像相关的处理上，Gemini略胜一筹；其他方面，两者旗鼓相当。

Python社区是高质量的Python/Django开发社区
本文地址：http://www.python88.com/topic/165401

登录后回复

关于移动版

Py学习 - 专注于Python技术发展的社区(原Django社区)

沪ICP备11025650号