社区
教程
Wiki
注册
登录
创作新主题
社区所有版块导航
Python
python开源
Django
Python
DjangoApp
pycharm
DATA
docker
Elasticsearch
分享
问与答
闲聊
招聘
翻译
创业
分享发现
分享创造
求职
区块链
支付之战
aigc
aigc
chatgpt
WEB开发
linux
MongoDB
Redis
DATABASE
NGINX
其他Web框架
web工具
zookeeper
tornado
NoSql
Bootstrap
js
peewee
Git
bottle
IE
MQ
Jquery
机器学习
机器学习算法
Python88.com
反馈
公告
社区推广
产品
短视频
印度
印度
一周十大热门主题
用Python优雅地写LaTeX
易点天下入选虎嗅智库大鲸榜AIGC数字营销技术商TOP15
从AIGC到AGI,为什么我们需要更多的“技术信仰派”?
ChatGPT,峰值已过?
香港科技大学(广州)机器学习基础实验室招收多名2024Fall/2025Spring博士生、研究助理...
免费课程:机器学习辅助材料模拟实践
开源机器学习编译器的“理想与现实” src:网页链接 -20240423084002
GitHub工业级开源软件:CAD 的官方源代码开放!
Open WebUI 私有部署本地chatgpt应用
自动驾驶十年:AI 大爆发、Transformer「登基」和特斯拉的 ChatGPT 时刻︱酷商业
关注
Py学习
»
机器学习算法
RTX 4090将机器学习速度提高3倍?黄仁勋:摩尔定律已死!
新智元
• 1 年前 • 220 次点击
新智元报道
编辑:武穆
【新智元导读】
英伟达正式发布RTX40系列显卡后,知乎上,「如何评价RTX40系列显卡」成为热议话题。从讨论内容看,网友对细节的讨论,还是很专业的。
老黄终于在今年的GTC(GPU技术大会)2022上,公布了RTX 40系列GPU的配置。
很快,在知乎上,RTX40系显卡就成了热议话题。
性能高了,功耗也大了
从网友的讨论方向看,对于RTX40系显卡,大家关心的主要就两点:
性能和价格。
对于RTX40系显卡的性能,大家基本买账。
下面这张RTX40 系显卡性能图,一直为网友津津乐道。
一位网友认为,RTX40 系列显卡,从架构和工艺上说,这是NVIDIA自Pascal,也就是10代以来各方面都提升最大的一代。
其他网友对RTX40系列性能的看法,也差不多。
比如,知乎上的一个名为「MebiuW」的科技博主认为,英伟达在这一代消费级显卡Ada Lovelace上用上了台积电的N4工艺,终于不像之前Ampere一样用着落后当时一代的工艺了。
不过,他觉得Ada Lovelace的首发的卡,虽然在理论性能上都是超过3090。但也就4090的提升比较大一些,4080系列无论对比3080还是对比3080Ti,提升都不足2倍。
从核心规格上,12GB的4080更像是3070的替代版本(3070 20T),16GB版本的4080更像是3070Ti的替代版本(22T)。
还有人干脆只放一张图,来表达他对40系显卡性能的看法:
总而言之,尽管在一些细节上,大家的看法有差别,但在一件事上,大家达成了共识:旗舰RTX 4090性价比最高。
也许是RTX 4090的性能实在让人印象深刻,外网Reddit甚至有人在讨论,RTX 4090
的cuda内核增加了50%,时钟速度提高了50%,如果再考虑到RTX 4090其他方面的优化,有了RTX 4090的加持,
能不能将机器学习速度提高2-3倍?
从下面留言看,外国网友显然没这么乐观。
一位叫「Michael_Aut」的网友评论道:「考虑到Roofline 模型(屋顶线模型),很多事情都受到内存吞吐量的约束,RTX 4090对机器学习没有那么大的推动作用。」
他特意用参数来做进一步说明。
最后,这位网友总结道:「是的,我不会期望新芯片能在任务中有更好的表现。实际上,从3080切换到12GB 4080时,性能说不定会出现一些退步。」
另一个取名「pommedeterresautee」的网友说:
「GPU编程中的大多数低效率都与从全局内存(DRAM)访问数据有关。对于e2e性能而言,速度快2倍的HBM3肯定与更快的计算速度一样重要。更大的l2缓存也会有所帮助。
只有像matmul和conv这样的张量收缩运算才能从DL中更快的计算中受益。
此外,如果使用新的fp8格式IRL,它可能会产生差异。Int8 quant很难使用,很少有人能够在prod等中部署它。」
当然,RTX40系列显卡的性能虽然总体上差强人意,但并非各方面都让人满意。
比如,RTX40系列显卡的功耗,就遭到了很多人的吐槽。
RTX 4090、RTX 4080(16G)、RTX 4080(12G)这三款显卡的功耗,分别为450W、320W和285W,系统电源功率要求分别为850W、750W和 700W。
考虑到
RTX30系列显卡的功耗已经不低了,升级后的
RTX40系列显卡功耗
还在增加,
难怪一位叫「老冯数码」的知乎网友戏称英伟达是「国家电网合作伙伴」。
不过,在另一大槽点面前,功耗什么的都是浮云。
在价格面前,一切都显得不重要
同性能相比,知乎上,大家对显卡价格的讨论要多得多。
啊,不,更准确地说,是吐槽要多得多。
一个网友说,对于英伟达的RTX 40系显卡,他只想说三点,定价离谱,定价离谱,定价离谱。
而一个叫「星话大白」的知乎网友,则站在游戏玩家的角度说,黄老板把原本的4070改成4080,价格提升84%,哪个玩家还买?至于30系新卡,他是不打算帮英伟达清库存了。
还有人专门做了一张表,让这次涨价变得更加醒目:
除了吐槽,有人对40系显卡的价格,还没有完全悲观。
一个叫「誓约胜利之剑」的网友说,「30系当初虽然定的低,但是发售后到今年以前,也从没按照原价卖过,定价只是官方觉得值这个价,具体卖多少取决于用户觉得值多少,至少30系目前矿卡存量如此巨大的情况,40系破发速度应该不会慢」。
看完网友们的吐槽,再看看老黄是怎么说的。
在公布RTX 40系列显卡后,针对显卡太贵,英伟达CEO黄仁勋回应道:
「一块12英寸的(硅)晶圆现在比昨天贵得多,而且不是贵了一点点,而是贵了很多。摩尔定律已死。根据摩尔定律,在相同的成本下,性能翻倍或者在相同的性能下,成本减半,这种能力已经不复存在。它完全结束了,因此芯片的成本会随着时间的推移而下降的想法,已是过去的事了。」
也许,老黄涨价真是迫不得已吧。
参考资料:
https://www.zhihu.com/question/554597854
https://www.reddit.com/r/MachineLearning/comments/xjt129/d_can_we_expect_rtx_4090_to_have_23x_machine/
Python社区是高质量的Python/Django开发社区
本文地址:
http://www.python88.com/topic/147674
220 次点击
登录后回复