社区教程 Wiki

注册登录

创作新主题

社区所有版块导航

Python

python开源 Django Python DjangoApp pycharm

DATA

docker Elasticsearch

分享

问与答闲聊招聘翻译创业分享发现分享创造求职区块链支付之战

aigc

aigc chatgpt

WEB开发

linux MongoDB Redis DATABASE NGINX 其他Web框架 web工具 zookeeper tornado NoSql Bootstrap js peewee Git bottle IE MQ Jquery

机器学习

机器学习算法

Python88.com

反馈公告社区推广

产品

短视频

印度

印度

一周十大热门主题

GitHub 调整 Copilot 学生计划，取消 GPT-5.4 等模型自选权限【AI 早报 20...

机器学习学术速递[3.11]

金宝书 3月9日晚间版 | 穆杰塔巴正式接任伊朗最高领袖、OpenClaw开源项目登顶GitHub热...

笑死？PUA Skills，让Agent极致工作，Github已2.3k star

机器学习学术速递[3.10]

机器学习学术速递[3.13]

深度学习冠状病毒蛋白质结构预测Cfold本地部署完全指南

两会聚焦，江苏广电总台人形机器人、AIGC等多形态融媒产品“出彩”

2026必看AI干货!《大模型/AIGC/GPT-4/Transformer/DL/KG/NLP/C...

【银河建筑】AIGC与新能源驱动液冷散热景气上行——散热材料行业深度 (一)

关注

Py学习 » chatgpt

谷歌Gemini和ChatGPT谁更厉害

未尽研究 • 2 年前 • 250 次点击

谷歌宣布推出其“最通用、功能最强大”的新大型语言模型Gemini 1.0。

Gemini有三个版本：适用于高度复杂任务的Gemini Ultra、适用于各种任务的最佳模型Gemini Pro和适用于手机等端侧设备的Gemini Nano。

发布会上，谷歌DeepMind首席执行官、Gemini团队代表德米斯·哈萨比斯（Demis Hassabis）正面谈及GPT-4与Gemini的对比，“我们对系统进行了非常彻底的分析，并进行了基准测试。谷歌运行了32个完善的基准测试来比较这两个模型，从广泛的整体测试（如多任务语言理解基准测试）到比较两个模型生成Python代码的能力。”哈萨比斯表示，“我认为我们在32项基准中的30项中大幅领先。”

果真如此吗？

威斯康辛大学教授Dimitris Papailiopoulos尝试将Gemini发布时展示的14道原题输入ChatGPT，看两个大模型到底谁更厉害。

我们一起来看一看：

第1题：验证一名学生解答的物理题

结果：GPT-4的答案和Gemini一样

第2题：inverse图像，GPT-4没那么厉害，但也没差那么多（毕竟付出了努力，但读图能力真不咋样）

第3题：辨别植物、关注细节

结果：打成平手

第4题：接下来的图像是什么？

结果：打成平手

第5题：几何推理

结果：GPT-4理解了，打成平手

第6题：高尔夫球和月球的关系

结果：打成平手

第7题：识别照片中的地点。

结果：GPT-4一开始拒绝提供相关信息，因为它认为这是在泄露隐私，但最终还是提供了。

第8题：解释笑话

结果：我认为GPT-4在这方面的能力更强些

第9题：中文里，如何称呼祖父母？

结果：打成平手

第10题：创建一个关于“负鼠”的谷歌搜索页面

结果：GPT-4没有添加图像，但它添加了一个“放入你最喜欢的负鼠图片”文件夹。我认为两者打成平手。

第11题：解方程式

结果：GPT-4太差劲了。0分！

第12题：多步骤推理

结果：打成平手，GPT-4使用了数据编译，我不知道这是否公平。

第13题：

翻转Matplotlib 图表，并在变更后增加两个函数。

结果：GPT-4不是百分百正确，而且它处理图像真的不行，我能说打成平手吗？

第14题：图表理解和推理

结果：打成平手

14道题中，ChatGPT答对12题。

总结：在图像相关的处理上，Gemini略胜一筹；其他方面，两者旗鼓相当。

Python社区是高质量的Python/Django开发社区
本文地址：http://www.python88.com/topic/165401

登录后回复

关于移动版

Py学习 - 专注于Python技术发展的社区(原Django社区)

沪ICP备11025650号