生死看淡,不服就干!AMD正式发布ROCm 6.0,剑指英伟达CUDA

长期以来,AMD的显卡销量一直被英伟达所吊打,双方差距非常悬殊,这两年差距甚至还有越拉越大的趋势,很多朋友不理解这是为什么。

比如,AMD的Radeon RX 7600的游戏性能完全可以追平英伟达的GeForce RTX 4060,而且价格还便宜30美元,AMD显卡的整体性价比明明更高,为什么销量始终处于下风呢?

因为显卡性能并不限于、不完全等于游戏性能,还包括生产力性能。比如各种视频编解码、各种工业3D动画渲染软件,还有现在爆红的人工智能运算,这些都是AMD显卡的重大短板。

这类应用的解决方案往往都是软硬件一体化的,而英伟达在这方面起步、发展得比较早,它的很多技术和解决方案,目前在很多专业领域成为了事实上的技术标准。

比如目前的人工智能领域,包括计算硬件、软件和第三方AI框架(比如TensorFlow),主流都是基于英伟达的CUDA解决方案,很明显,这对AMD(和英特尔等其它显卡厂商)非常不利。

现在几乎所有的人工智能项目和开发书籍,都会优先推荐使用英伟达的显卡,不支持AMD显卡,或者效率低很多,甚至直接无法安装、运行。

在这种背景下,只有部分消费级用户会选择购买AMD显卡,主要用于游戏娱乐,这是没问题的。而除此之外的绝大部分商业用户,都会优先选择英伟达的显卡,即使价格高很多,这就造成了AMD显卡和英伟达显卡销量悬殊的局面。

目前,人工智能是未来技术发展的大方向,它已经不再限于商业级应用场景,已经开始慢慢地向普通消费级市场渗透。比如目前的主流手机处理器都搭载了NPU人工智能计算单元,传闻中的Windows12也将采用人工智能重构,而未来台式机处理器也会朝这个方向发展。

这种发展趋势现在已经非常明朗,这几年AMD也开始积极地在人工智能领域发力,开始追赶英伟达。比如,AMD在最近两代移动版处理器中就加入了人工智能计算单元。

但是目前这些努力还是远远不够的,抛开AMD GPU的AI算力先不谈,它还必须要先提出一套高效,优秀的,能为业界所能接受的,类似英伟达的CUDA计算解决方案。

对此,AMD提出的解决方案为“ROCm”,英文全称为“Radeon Open Compute Platform” ,中文名称为Radeon开源计算平台,是开源项目。

该方案旨在为高性能计算和机器学习应用提供支持,基于GPU计算,通过开放的编程模型和标准的API,使开发者能够利用AMD的GPU资源进行高效的数据处理和计算,在科学计算、深度学习和数据分析等领域有着广泛的应用前景。

不过,ROCm自推出后表现始终不温不火,但AMD并没有放弃,一直在努力改进提升,该公司在最近举办的“向AI推进”的活动中,AMD发布了ROCm 6.0,目前已经开放源代码下载。

ROCm 6.0除了支持AMD自家最新的Instinct MI300A/MIX300X AIGPU之外,还有以下几个亮点:

一、改进了低精度数学计算和注意力算法等方面的性能。二、新增hipSPARSELt库,可通过 AMD 的稀疏矩阵核心技术加速AI运算。三、新增对DeepSpeed、ONNX-RT和CuPy等库的支持。

四、支持各种主流的AI框架,比如TensorFlow、JAX和PyTorch。五、向开发人员提供更多、完善的技术支持,包括预打包的HPC和AI/ML框架可在AMD Infinity Hub上下载,提供全新和经过改进的ROCm开发文档和资源。

对于ROCm 6.0,AMD方面信心十足,声称ROCm 6.0在大型语言模型训练方面已经达到了与CUDA持平的水平。

客观来说,AMD想在短期内在人工智能领域追平英伟达是不现实的,毕竟英伟达在该领域已经厚积薄发、深耕了很多年。但是现在AMD已经开始火力全开,虽然仍有差距,但在一定程度上会对英伟达形成较大的竞争压力,而这总是有利于市场和技术进步的。

至于ROCm 6.0的实际表现到底怎么样?前景到底如何?其最终能否为大型商业用户所接受,现在还很难估计预测,还有待观察,希望AMD行稳致远。

展开阅读全文

页面更新:2024-05-09

标签:英伟   都会   高效   人工智能   销量   处理器   显卡   生死   性能   解决方案   领域

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top