英伟达于美国当地时间9日推出了一款专为大规模上下文推理处理与视频生成ai应用打造的全新gpu——rubin cpx。这款gpu基于“rubin”架构设计,尽管与此前发布的rubin tensor core gpu共享部分技术基础,但在多个关键特性上存在显著差异。
Rubin CPX GPU采用了成本优化的单片式芯片设计方案,重点强化了对NVFP4数据格式的计算能力支持,并集成了NVENC/NVDNC视频编解码模块,配备高达128GB的GDDR7显存,进一步提升了其在多媒体处理场景下的性能表现。
根据英伟达公布的Rubin CPX GPU结构渲染图显示,该芯片包含4×4×3×4=192个重复功能单元(如图中黄色框所示),推测对应192个SM单元,这一规模与GB202芯片相当。

在系统层面,从Vera Rubin NVL144升级至Vera Rubin NVL144 CPX后,新增了144块Rubin CPX GPU,使得整体系统的NVFP4算力提升了4.4 EFLOPS,显存带宽增加0.3 PB/s,快速存储容量扩展了25TB。
降重鸟
要想效果好,就用降重鸟。AI改写智能降低AIGC率和重复率。
113 查看详情

从显存带宽来看,单颗Rubin CPX GPU的带宽约为2083 GB/s。参考具备512-bit显存位宽的GeForce RTX 5090提供1792 GB/s带宽,以及Rubin CPX GPU拥有128GB GDDR7显存的事实,可推断其同样采用512-bit显存接口,显存等效速率预计达到约32.55 Gbps。
以上就是英伟达Rubin CPX GPU包含192个重复单元 预计采用512bit显存位宽的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/238197.html
微信扫一扫
支付宝扫一扫