日日躁夜夜躁狠狠躁超碰97,无码国内精品久久综合88 ,热re99久久精品国99热,国产萌白酱喷水视频在线播放

歡迎訪問深圳市中小企業(yè)公共服務平臺電子信息窗口

美國不遺余力限制我國算力發(fā)展,GPU國產替代如何才能突破?

2024-02-22 來源:賢集網
5761

關鍵詞: 芯片 英特爾 AMD

眾所周知,目前美國對中國的芯片限制越來越嚴格,在GPU上面也是如此。

2022年美國禁掉了高性能GPU芯片,包括A100、H100等,而2023年又禁掉了A800、H800、L40、L40S,甚至連桌面端顯卡RTX 4090都禁了。

美國不希望中國擁有先進的GPU算力,從而在AI上超過美國。

于是有同學們會問了,那就是國產GPU能不能頂上?能不能替代nvidia、AMD這兩大巨頭?



國產GPU既有好也有差

事實上,GPU芯片目前主要分為兩種,一種是普通GPU芯片,用于渲染的,我們也可以認為就是游戲加速,圖形顯示這些使用的普通顯卡。

在這一塊,國內在研制的比較多,但是份額相當少,數(shù)據(jù)顯示,英特爾、AMD、nvidia這三大廠商占了全球98%以上的渲染類GPU市場,國產合計都不到2%。份額雖然少,不過性能方面,卻已經不再落后nvidia、amd等多少了,比如芯動科技推出的高性能的4K級顯卡GPU芯片“風華 1 號”,12nm工藝,性能略優(yōu)于Nvidia的GTX980顯卡。

再比如摩爾線程專為游戲玩家打造的獨立顯卡 MTT S80,能夠提供多達 14.4TFLOPS 的單精度浮點算力,也是能夠與nvida打一打的。

還有景嘉微等,也有推出一些國產渲染類顯卡,不過由于時間較短,生態(tài)方面略遜色一點,所以份額不高,但要替代上來,在游戲方面,還是能夠頂一頂?shù)摹?/span>

GPU芯片中,還有另外一種,叫做AI加速卡,比如英偉達的A100、H100、A800、H800等,主要服務于AI模型訓練和推理等新興的算力需求。

目前AI顯卡方面,NVIDIA處于統(tǒng)治地位,市場份額超過97%,AMD拿走了2%,其它廠商加起來可能還不到1%。這一塊追求的就完全是性能了,比如英偉達的H100,完全是打遍天下沒有對手的。



中國企業(yè)瞄準存算一體AI芯片

生成式AI和大模型時代向算力基礎設施提出的核心要求,可以簡單概括為幾個詞:提高單芯片算力,突破算力利用率,實現(xiàn)更高能效比。

上海交通大學計算機科學與工程系教授、博導梁曉峣及其團隊是開源GPGPU平臺“青花瓷”的發(fā)起者。他談道,當下需從系統(tǒng)的角度來思考問題。首先在單芯片算力方面,他非常看好存算一體,認為通過引入新型存儲器件工藝,存算一體AI芯片有望將單芯片算力提高1——2個數(shù)量級。

但單顆芯片很難為大模型提供充足的計算資源與存儲資源,這就需要將很多計算芯片連在一起,形成系統(tǒng)。據(jù)韓媒報道,受ChatGPT熱潮驅動,韓國兩大存儲芯片巨頭三星電子、SK海力士的高帶寬內存(HBM)接單量大增。

芯片與芯片之間的數(shù)據(jù)傳輸過程,往往會造成大量不必要的資源浪費,導致計算系統(tǒng)受限于傳輸帶寬瓶頸,在實際應用中發(fā)揮的算力遠小于理論峰值算力。要進一步提升計算資源利用率,必須研究更先進的互連技術,以實現(xiàn)成千上萬個AI芯片之間的高效協(xié)同。

最后,軟件的迭代升級亦不可或缺。要降低芯片開發(fā)門檻并實現(xiàn)所有芯片的高效協(xié)同,需要設計分布式的AI編程軟件平臺,來解決線程調度、同步、任務平衡等復雜問題。

“沒有一個單芯片能夠獨立解決大模型問題,所以一定是走向一個超異構?!绷簳詬i說,盡管他很看好存算一體路線,但僅靠存算一體還不夠,還需與其他架構配合,形成一個完整的系統(tǒng)。

億鑄科技首次提出的“存算一體超異構”概念,就有可能是一個未來的理想組合。

超異構計算將CPU、GPGPU、CIM(存內計算)等不同類型的芯片用先進封裝技術組合,讓不同架構各司其職,既有靈活、可編程的部分來適應算法的快速變化,又有定制化部分來提供超高性能和超低功耗,通過統(tǒng)籌調度,綜合發(fā)揮出多類芯片架構的優(yōu)勢,將整體效率做到最優(yōu)。

由于器件優(yōu)勢,存算一體在同等功耗下能承擔更大算力。在超異構計算的基礎上,以存算一體架構為核心,以其他架構作輔助,理論上能夠兼顧對高算力與通用性的需求。億鑄科技創(chuàng)始人、董事長兼CEO熊大鵬博士相信,存算一體超異構將來會成為AI算力芯片的主流技術路線之一。

在今年2月份舉行的國際芯片設計領域最高級別會議ISSCC 2023大會上,AMD董事長兼CEO蘇姿豐也提出了相似的“系統(tǒng)級創(chuàng)新”概念,即綜合考慮跨計算、跨通信、跨內存等各項元素,從整體上推動系統(tǒng)級性能和能效的提升。

而存算一體超異構理念的前瞻性和落地可行性在于,它不像基于傳統(tǒng)計算架構的大算力芯片那樣依賴先進制造技術。這一思路需結合的新架構、新存儲、新封裝等前沿技術,國內均已有儲備。


英偉達芯片遇冷

國產GPU能否奮起?


當前,AI應用呈“井噴”式發(fā)展,算力需求暴漲,作為AI算力的核心,GPU儼然已成為炙手可熱的“硬通貨”,在此次展會上,英偉達也一口氣推出三款新品?;仡?023年,憑借GPU芯片和以CUDA、數(shù)據(jù)中心專用GPU、軟件庫等為基礎的AI生態(tài),英偉達持續(xù)迎來“高光”時刻,美股市值達到上萬億美元,全年累漲近240%,創(chuàng)2001年以來最大年度漲幅。



然而,盡管英偉達在市場上氣勢如虹,后院卻頻頻起火。去年10月,美國再次收緊AI芯片的出口管制政策,但中國市場的收入占到英偉達總營收的1/5左右,實在難以割舍。為此,英偉達展開了一場限制與反限制的“貓鼠游戲”,為中國市場量身定制了“降級版”芯片。但最近兩天,外媒傳出中國客戶對英偉達“降級版”芯片興趣不高的消息。

事實上,國內相關企業(yè)此前已經拿到“降級版”芯片樣品進行測試,并被曝大量縮減相關訂單。在行業(yè)人士看來,這款芯片不受待見的原因有三,一是性能大幅削弱,價格卻并未下降。二是供應鏈風險,芯片限制政策可能會升級,不確定英偉達能否持續(xù)供貨。三是使用“降級版”芯片將面臨更多問題,如封裝技術挑戰(zhàn)、散熱能耗更高等。

但如此前業(yè)內人士所言,目前英偉達H800的缺口有45萬片,業(yè)界整體面臨算力從哪來的問題。因此,短期內“降級版”芯片在國內依舊有市場。國內科技企業(yè)的工程師們也表示,未來12個月英偉達的芯片仍將是采購重點,因為英偉達的產品生態(tài)系統(tǒng)更加完善,而且本土替代品仍供應不足。

不過,對供需雙方來說,“低配版”芯片始終不是長久之計,且在美國持續(xù)升級芯片限制政策的背景下,英偉達的供貨極有可能波瀾四起。因此,國內科技企業(yè)也積極調整產業(yè)策略,為未來減少使用英偉達芯片做準備,從而避免不斷調整技術以適應新芯片的巨大代價。阿里和騰訊等云廠商將一些先進的半導體訂單轉移給華為等本土公司,并更多地依賴其內部開發(fā)的芯片,百度和字節(jié)跳動等企業(yè)也采取了類似措施。顯然,國內企業(yè)選擇“英偉達+自研+國產芯片”三管齊下進行探路。

常言道,三十年河東三十河西,當下華為昇騰910B、寒武紀思元370或許還不如英偉達“降級版”芯片,但從長遠來看,華為、寒武紀等中國GPU企業(yè)持續(xù)加強產品研發(fā)和生態(tài)建設,實現(xiàn)GPU芯片的國產替代和系統(tǒng)化應用也只是時間問題。

當前,我國各類半導體器件都在加快國產化進程,美國的芯片出口管制政策反而將促進我國半導體發(fā)展進步。因為擋在國產半導體面前的,一直是外部過于廉價的供應,將產業(yè)磨滅在萌芽期,而在國際供應鏈不確定性背景下,國內芯片發(fā)展將迎來絕佳窗口期?;仡櫳鲜兰o八九十年代,韓國半導體逆襲日本離不開政策、資金的鼎力相助,更離不開企業(yè)的“背水一戰(zhàn)”,而如今的中國有政策、資金的大力支持,也不乏默默付出的耕耘者,實現(xiàn)國產替代的時間或許很長,但如同華為Mate60的發(fā)布,驚喜總會出現(xiàn)在某個平常日子里。