美國不遺余力限制我國算力發(fā)展，GPU國產(chǎn)替代如何才能突破？

2024-02-22 來源：賢集網(wǎng)

6357

眾所周知，目前美國對(duì)中國的芯片限制越來越嚴(yán)格，在GPU上面也是如此。

2022年美國禁掉了高性能GPU芯片，包括A100、H100等，而2023年又禁掉了A800、H800、L40、L40S，甚至連桌面端顯卡RTX 4090都禁了。

美國不希望中國擁有先進(jìn)的GPU算力，從而在AI上超過美國。

于是有同學(xué)們會(huì)問了，那就是國產(chǎn)GPU能不能頂上？能不能替代nvidia、AMD這兩大巨頭？

國產(chǎn)GPU既有好也有差

事實(shí)上，GPU芯片目前主要分為兩種，一種是普通GPU芯片，用于渲染的，我們也可以認(rèn)為就是游戲加速，圖形顯示這些使用的普通顯卡。

在這一塊，國內(nèi)在研制的比較多，但是份額相當(dāng)少，數(shù)據(jù)顯示，英特爾、AMD、nvidia這三大廠商占了全球98%以上的渲染類GPU市場(chǎng)，國產(chǎn)合計(jì)都不到2%。份額雖然少，不過性能方面，卻已經(jīng)不再落后nvidia、amd等多少了，比如芯動(dòng)科技推出的高性能的4K級(jí)顯卡GPU芯片“風(fēng)華 1 號(hào)”，12nm工藝，性能略優(yōu)于Nvidia的GTX980顯卡。

再比如摩爾線程專為游戲玩家打造的獨(dú)立顯卡 MTT S80，能夠提供多達(dá) 14.4TFLOPS 的單精度浮點(diǎn)算力，也是能夠與nvida打一打的。

還有景嘉微等，也有推出一些國產(chǎn)渲染類顯卡，不過由于時(shí)間較短，生態(tài)方面略遜色一點(diǎn)，所以份額不高，但要替代上來，在游戲方面，還是能夠頂一頂?shù)摹?/span>

GPU芯片中，還有另外一種，叫做AI加速卡，比如英偉達(dá)的A100、H100、A800、H800等，主要服務(wù)于AI模型訓(xùn)練和推理等新興的算力需求。

目前AI顯卡方面，NVIDIA處于統(tǒng)治地位，市場(chǎng)份額超過97%，AMD拿走了2%，其它廠商加起來可能還不到1%。這一塊追求的就完全是性能了，比如英偉達(dá)的H100，完全是打遍天下沒有對(duì)手的。

中國企業(yè)瞄準(zhǔn)存算一體AI芯片

生成式AI和大模型時(shí)代向算力基礎(chǔ)設(shè)施提出的核心要求，可以簡(jiǎn)單概括為幾個(gè)詞：提高單芯片算力，突破算力利用率，實(shí)現(xiàn)更高能效比。

上海交通大學(xué)計(jì)算機(jī)科學(xué)與工程系教授、博導(dǎo)梁曉峣及其團(tuán)隊(duì)是開源GPGPU平臺(tái)“青花瓷”的發(fā)起者。他談道，當(dāng)下需從系統(tǒng)的角度來思考問題。首先在單芯片算力方面，他非?？春么嫠阋惑w，認(rèn)為通過引入新型存儲(chǔ)器件工藝，存算一體AI芯片有望將單芯片算力提高1——2個(gè)數(shù)量級(jí)。

但單顆芯片很難為大模型提供充足的計(jì)算資源與存儲(chǔ)資源，這就需要將很多計(jì)算芯片連在一起，形成系統(tǒng)。據(jù)韓媒報(bào)道，受ChatGPT熱潮驅(qū)動(dòng)，韓國兩大存儲(chǔ)芯片巨頭三星電子、SK海力士的高帶寬內(nèi)存（HBM）接單量大增。

芯片與芯片之間的數(shù)據(jù)傳輸過程，往往會(huì)造成大量不必要的資源浪費(fèi)，導(dǎo)致計(jì)算系統(tǒng)受限于傳輸帶寬瓶頸，在實(shí)際應(yīng)用中發(fā)揮的算力遠(yuǎn)小于理論峰值算力。要進(jìn)一步提升計(jì)算資源利用率，必須研究更先進(jìn)的互連技術(shù)，以實(shí)現(xiàn)成千上萬個(gè)AI芯片之間的高效協(xié)同。

最后，軟件的迭代升級(jí)亦不可或缺。要降低芯片開發(fā)門檻并實(shí)現(xiàn)所有芯片的高效協(xié)同，需要設(shè)計(jì)分布式的AI編程軟件平臺(tái)，來解決線程調(diào)度、同步、任務(wù)平衡等復(fù)雜問題。

“沒有一個(gè)單芯片能夠獨(dú)立解決大模型問題，所以一定是走向一個(gè)超異構(gòu)?！绷簳詬i說，盡管他很看好存算一體路線，但僅靠存算一體還不夠，還需與其他架構(gòu)配合，形成一個(gè)完整的系統(tǒng)。

億鑄科技首次提出的“存算一體超異構(gòu)”概念，就有可能是一個(gè)未來的理想組合。

超異構(gòu)計(jì)算將CPU、GPGPU、CIM（存內(nèi)計(jì)算）等不同類型的芯片用先進(jìn)封裝技術(shù)組合，讓不同架構(gòu)各司其職，既有靈活、可編程的部分來適應(yīng)算法的快速變化，又有定制化部分來提供超高性能和超低功耗，通過統(tǒng)籌調(diào)度，綜合發(fā)揮出多類芯片架構(gòu)的優(yōu)勢(shì)，將整體效率做到最優(yōu)。

由于器件優(yōu)勢(shì)，存算一體在同等功耗下能承擔(dān)更大算力。在超異構(gòu)計(jì)算的基礎(chǔ)上，以存算一體架構(gòu)為核心，以其他架構(gòu)作輔助，理論上能夠兼顧對(duì)高算力與通用性的需求。億鑄科技創(chuàng)始人、董事長兼CEO熊大鵬博士相信，存算一體超異構(gòu)將來會(huì)成為AI算力芯片的主流技術(shù)路線之一。

在今年2月份舉行的國際芯片設(shè)計(jì)領(lǐng)域最高級(jí)別會(huì)議ISSCC 2023大會(huì)上，AMD董事長兼CEO蘇姿豐也提出了相似的“系統(tǒng)級(jí)創(chuàng)新”概念，即綜合考慮跨計(jì)算、跨通信、跨內(nèi)存等各項(xiàng)元素，從整體上推動(dòng)系統(tǒng)級(jí)性能和能效的提升。

而存算一體超異構(gòu)理念的前瞻性和落地可行性在于，它不像基于傳統(tǒng)計(jì)算架構(gòu)的大算力芯片那樣依賴先進(jìn)制造技術(shù)。這一思路需結(jié)合的新架構(gòu)、新存儲(chǔ)、新封裝等前沿技術(shù)，國內(nèi)均已有儲(chǔ)備。

英偉達(dá)芯片遇冷

國產(chǎn)GPU能否奮起？

當(dāng)前，AI應(yīng)用呈“井噴”式發(fā)展，算力需求暴漲，作為AI算力的核心，GPU儼然已成為炙手可熱的“硬通貨”，在此次展會(huì)上，英偉達(dá)也一口氣推出三款新品?；仡?023年，憑借GPU芯片和以CUDA、數(shù)據(jù)中心專用GPU、軟件庫等為基礎(chǔ)的AI生態(tài)，英偉達(dá)持續(xù)迎來“高光”時(shí)刻，美股市值達(dá)到上萬億美元，全年累漲近240%，創(chuàng)2001年以來最大年度漲幅。

然而，盡管英偉達(dá)在市場(chǎng)上氣勢(shì)如虹，后院卻頻頻起火。去年10月，美國再次收緊AI芯片的出口管制政策，但中國市場(chǎng)的收入占到英偉達(dá)總營收的1/5左右，實(shí)在難以割舍。為此，英偉達(dá)展開了一場(chǎng)限制與反限制的“貓鼠游戲”，為中國市場(chǎng)量身定制了“降級(jí)版”芯片。但最近兩天，外媒傳出中國客戶對(duì)英偉達(dá)“降級(jí)版”芯片興趣不高的消息。

事實(shí)上，國內(nèi)相關(guān)企業(yè)此前已經(jīng)拿到“降級(jí)版”芯片樣品進(jìn)行測(cè)試，并被曝大量縮減相關(guān)訂單。在行業(yè)人士看來，這款芯片不受待見的原因有三，一是性能大幅削弱，價(jià)格卻并未下降。二是供應(yīng)鏈風(fēng)險(xiǎn)，芯片限制政策可能會(huì)升級(jí)，不確定英偉達(dá)能否持續(xù)供貨。三是使用“降級(jí)版”芯片將面臨更多問題，如封裝技術(shù)挑戰(zhàn)、散熱能耗更高等。

但如此前業(yè)內(nèi)人士所言，目前英偉達(dá)H800的缺口有45萬片，業(yè)界整體面臨算力從哪來的問題。因此，短期內(nèi)“降級(jí)版”芯片在國內(nèi)依舊有市場(chǎng)。國內(nèi)科技企業(yè)的工程師們也表示，未來12個(gè)月英偉達(dá)的芯片仍將是采購重點(diǎn)，因?yàn)橛ミ_(dá)的產(chǎn)品生態(tài)系統(tǒng)更加完善，而且本土替代品仍供應(yīng)不足。

不過，對(duì)供需雙方來說，“低配版”芯片始終不是長久之計(jì)，且在美國持續(xù)升級(jí)芯片限制政策的背景下，英偉達(dá)的供貨極有可能波瀾四起。因此，國內(nèi)科技企業(yè)也積極調(diào)整產(chǎn)業(yè)策略，為未來減少使用英偉達(dá)芯片做準(zhǔn)備，從而避免不斷調(diào)整技術(shù)以適應(yīng)新芯片的巨大代價(jià)。阿里和騰訊等云廠商將一些先進(jìn)的半導(dǎo)體訂單轉(zhuǎn)移給華為等本土公司，并更多地依賴其內(nèi)部開發(fā)的芯片，百度和字節(jié)跳動(dòng)等企業(yè)也采取了類似措施。顯然，國內(nèi)企業(yè)選擇“英偉達(dá)+自研+國產(chǎn)芯片”三管齊下進(jìn)行探路。

常言道，三十年河?xùn)|三十河西，當(dāng)下華為昇騰910B、寒武紀(jì)思元370或許還不如英偉達(dá)“降級(jí)版”芯片，但從長遠(yuǎn)來看，華為、寒武紀(jì)等中國GPU企業(yè)持續(xù)加強(qiáng)產(chǎn)品研發(fā)和生態(tài)建設(shè)，實(shí)現(xiàn)GPU芯片的國產(chǎn)替代和系統(tǒng)化應(yīng)用也只是時(shí)間問題。

當(dāng)前，我國各類半導(dǎo)體器件都在加快國產(chǎn)化進(jìn)程，美國的芯片出口管制政策反而將促進(jìn)我國半導(dǎo)體發(fā)展進(jìn)步。因?yàn)閾踉趪a(chǎn)半導(dǎo)體面前的，一直是外部過于廉價(jià)的供應(yīng)，將產(chǎn)業(yè)磨滅在萌芽期，而在國際供應(yīng)鏈不確定性背景下，國內(nèi)芯片發(fā)展將迎來絕佳窗口期?；仡櫳鲜兰o(jì)八九十年代，韓國半導(dǎo)體逆襲日本離不開政策、資金的鼎力相助，更離不開企業(yè)的“背水一戰(zhàn)”，而如今的中國有政策、資金的大力支持，也不乏默默付出的耕耘者，實(shí)現(xiàn)國產(chǎn)替代的時(shí)間或許很長，但如同華為Mate60的發(fā)布，驚喜總會(huì)出現(xiàn)在某個(gè)平常日子里。