日日躁夜夜躁狠狠躁超碰97,无码国内精品久久综合88 ,热re99久久精品国99热,国产萌白酱喷水视频在线播放

歡迎訪問深圳市中小企業(yè)公共服務(wù)平臺(tái)電子信息窗口

AMD ROCm 7開源軟件堆棧即將發(fā)布,挑戰(zhàn)NVIDIA CUDA市場(chǎng)地位

2025-09-18 來源:電子工程專輯
71

關(guān)鍵詞: AMD ROCm 7 開源軟件堆棧 AI推理性能 CUDA壟斷

近日,AMD正加速推進(jìn)其開源軟件堆棧ROCm 7的發(fā)布計(jì)劃,旨在打破英偉達(dá)(NVIDIA) CUDA在AI領(lǐng)域的長(zhǎng)期壟斷。根據(jù)外媒報(bào)道,AMD已在GitHub上發(fā)布了ROCm 7的版本標(biāo)簽(release tag),包括HIP(Heterogeneous-Compute Interface for Portability)、AOMP與ROCm Libraries,標(biāo)志著該軟件堆棧已接近最終版本,預(yù)計(jì)將在未來數(shù)周內(nèi)正式推出。

性能飛躍,AI推理最高提速3.5倍

在早些時(shí)候的Advancing AI活動(dòng)上,AMD公布了ROCm 7的效能數(shù)據(jù)。據(jù)介紹,ROCm 7相較于上一代ROCm 6,在AI推理效能上最高可提升3.5倍,部分工作負(fù)載的訓(xùn)練性能提升甚至可達(dá)3.8倍,顯著優(yōu)化了在AMD Instinct系列GPU上的AI計(jì)算效率。

這一顯著提升得益于ROCm 7集成了最新算法與模型,以及針對(duì)AMD GPU硬件的深度優(yōu)化。

特別值得一提的是,基于CDNA 4架構(gòu)的Instinct MI355X GPU在DeepSeek R1測(cè)試中,F(xiàn)P8吞吐量表現(xiàn)比NVIDIA B200高出30%。盡管這項(xiàng)數(shù)據(jù)目前仍僅為AMD公布的內(nèi)部測(cè)試結(jié)果,尚未經(jīng)第三方驗(yàn)證,但已足以展示AMD在AI計(jì)算領(lǐng)域的雄心壯志。若該數(shù)據(jù)屬實(shí),將意味著AMD在特定AI推理場(chǎng)景下實(shí)現(xiàn)了對(duì)當(dāng)前頂級(jí)競(jìng)品的性能超越。

開源特性與完整框架支持,挑戰(zhàn)CUDA壟斷

NVIDIA的CUDA軟件棧因其硬件獨(dú)占性和高度集成的生態(tài)系統(tǒng),長(zhǎng)期以來在AI領(lǐng)域占據(jù)主導(dǎo)地位,形成了上下游高度綁定的市場(chǎng)格局,使得其他競(jìng)爭(zhēng)者難以切入。AMD此次強(qiáng)調(diào)ROCm 7的開源特性,旨在提供更完整的框架支持、硬件兼容性與開發(fā)工具,力圖打破CUDA的市場(chǎng)壁壘。

ROCm 7不僅支持最新算法和模型,還擴(kuò)展了對(duì)AMD銳龍AI處理器和Radeon顯卡的兼容性,包括對(duì)MI350系列GPU的適配,并新增了對(duì)Ubuntu 24.04.3 LTS和Rocky Linux 9的系統(tǒng)兼容性支持。

此外,該套件還提供了對(duì)PyTorch 2.7、TensorFlow 2.19.1、ONNX Runtime 1.22.0、JAX 0.6.0、Triton 3.3.0、vLLM等一系列主流AI框架的支持,進(jìn)一步提升了其在大規(guī)模AI部署中的可擴(kuò)展性與穩(wěn)定性。

NVIDIA CUDA在AI領(lǐng)域的這種壟斷并非不可動(dòng)搖,尤其是面對(duì)來自中國市場(chǎng)的強(qiáng)烈需求,AMD正通過增強(qiáng)框架與全新算法,以及持續(xù)的性能優(yōu)化,正逐步縮小與英偉達(dá)的差距,但其挑戰(zhàn)依然嚴(yán)峻。開發(fā)者對(duì)CUDA的依賴性,使得他們?cè)谶w移到其他平臺(tái)時(shí)面臨顯著的學(xué)習(xí)曲線。

責(zé)編:Luffy