社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

【深度学习】RTX 5090最新爆料:架构大改,性能提升70%

机器学习算法那些事 • 1 年前 • 168 次点击  

机器之心报道  编辑:小舟

关于英伟达下一代旗舰 GPU RTX5090,人们一直抱有期待和猜测。
早在 2021 年,知名爆料者 kopite7kimi 就称英伟达将推出代号为「Blackwell」的 GPU 架构。
Blackwell 有望成为 Ada Lovelace 架构的继任者,被认为是 RTX 5090 的架构。与 Hopper/Ada 架构相比,Blackwell 计划将其覆盖范围扩展到数据中心和消费级 GPU。
现在,Chiphell 论坛上的知名爆料者 Panzerlied 又提供了更多信息:相比于 RTX 4090,RTX 5090 整体性能提升 70%。具体来说,爆料称 RTX 5090 将包括如下改进:
  • CUDA 内核数增加 50%,达到 24576 个;
  • 内存带宽增加 52%;
  • 缓存(cache)增加 78%;
  • 频率提高 15%。
Chiphell 论坛上的爆料信息。
据外媒 videocardz 报道,kopite7kimi 基本认同这些信息,但他在个人推特上表示:「Blackwell 不会明显增加 GPC、TPC 等计算单元的数量,但单元结构可能会进行重大重组。」
此外,kopite7kimi 还提到 Blackwell 架构 GPU GB100 采用了多芯片模块(MCM)设计。这表明英伟达将采用先进的封装技术,提供更大的灵活性,来为消费者定制芯片。
图源:https://videocardz.com/newz/nvidia-blackwell-gb100-to-utilize-mcm-design-gpu-unit-structure-to-see-major-reorganization
如果考虑到具有 21 Gbps 内存的 RTX 4090 将升级至 32 Gbps,那么可以推测 RTX 50 系列可能会采用 GDDR7 技术。
以 RTX 4090 作为参考,频率增加 15% 将转化为 2.9 GHz 升压时钟,RTX 5090 实际工作负载可能会达到 3.0 GHz 或更高的时钟;缓存增加 78% 表明 RTX 5090(GB202)将具有 128MB 的二级缓存。
如果将上述爆料综合起来,RTX 5090 GPU 可能是这样的:
图源:https://videocardz.com/newz/nvidia-geforce-rtx-5090-rumors-2-9-ghz-boost-clock-1-5-tb-s-bandwidth-and-128mb-of-l2-cache
不过,RTX 40 系列刚刚发布一年,按照英伟达每两年更新主要通用 GPU 架构的计划,Blackwell 架构的 RTX 50 系列可能不会很快到来。
参考链接:
https://videocardz.com/newz/nvidia-geforce-rtx-5090-rumors-2-9-ghz-boost-clock-1-5-tb-s-bandwidth-and-128mb-of-l2-cache
https://videocardz.com/newz/nvidia-blackwell-gb100-to-utilize-mcm-design-gpu-unit-structure-to-see-major-reorganization
https://www.cnbeta.com.tw/articles/tech/1384823.htm

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/162274
 
168 次点击