9月16日,nvidia在ai领域的强势地位不仅源于其gpu的强大性能,更得益于cuda软件生态的深厚积累,这一生态体系被视为其在ai战场上的核心壁垒。
面对竞争,AMD正加速构建自己的AI开发生态。继6月宣布推出全新ROCm 7之后,今日该平台已正式发布,标志着AMD向CUDA生态发起正面挑战。值得一提的是,ROCm 7为开源项目,现已在Github上线,供全球开发者使用。
此次更新带来了多项关键升级,包括对MI350X与MI355X显卡的支持, 实现了这两款GPU的KVM直通功能,并全面兼容PyTorch 2.7、TensorFlow 2.19.1、ONNX 1.22、Triton 3.3 和 JAX 0.6.0等主流AI框架。
更多技术细节可查阅ROCm官方文档:rocm.docs.amd.com。

在早前的发布会上,AMD展示了ROCm 7的实际性能表现,运行Llama 3.1 70B模型时性能提升达3.2倍,Qwen2-72B提升3.4倍,DeepSeek R1更是实现了3.8倍的显著提速。
灵云AI开放平台
灵云AI开放平台
150 查看详情
在训练场景中,Llama 2 70B、Llama 3.1 8B以及Qwen 1.5 7B等模型的平均性能提升也达到了3倍之多。
此外,AMD透露,2024年内将持续优化ROCm 7生态,计划扩展至锐龙平台的笔记本和工作站,全面支持Linux系统,并将首次正式引入对Windows系统的支持,此前长期困扰开发者的兼容性问题正在逐一攻克。

以上就是CUDA来战 AMD ROCm 7软件平台正式发布:AI性能3.5倍提升的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/750967.html
微信扫一扫
支付宝扫一扫