英偉達(dá)禁令之后,中國(guó)AI計(jì)算何去何從?
10月17日,美國(guó)加強(qiáng)了面向中國(guó)市場(chǎng)的AI芯片禁令。其中明確將性能、密度作為出口管制標(biāo)準(zhǔn),將單芯片超過(guò)300teraflops算力,以及性能密度超過(guò)每平方毫米370 gigaflops的芯片都納入了禁止出口行列。
雖然在這一禁令下,AMD、英特爾等公司提供的高端AI芯片也受到影響。但由于英偉達(dá)在全球AI芯片領(lǐng)域一家獨(dú)大,本次禁令涉及A100、H100等主流AI訓(xùn)練用英偉達(dá)GPU,因此這次的芯片禁令也被稱為“英偉達(dá)禁令”。
消息一出,立刻引起了AI產(chǎn)業(yè)的熱議。但討論大多集中在禁令何時(shí)施行,是否有緩沖地帶,具體涉及哪些GPU型號(hào),禁令期限是多久等。這就導(dǎo)致一個(gè)顯而易見(jiàn)的宏觀背景被忽略了:自貿(mào)易摩擦發(fā)生以來(lái),中美經(jīng)貿(mào)關(guān)系雖然時(shí)有波動(dòng),但面向中國(guó)的芯片管控卻始終有增無(wú)減。尤其是高端AI芯片禁令,在諸多爭(zhēng)議中依舊被堅(jiān)定推行。
至此,AI行業(yè)似乎已經(jīng)必須形成一個(gè)基本的共識(shí):拋棄幻想,準(zhǔn)備斗爭(zhēng)。
與其斤斤計(jì)較哪些GPU被禁,是否有解禁可能。不如重新審視在芯片鐵幕時(shí)代下,中國(guó)AI計(jì)算究竟何去何從?
本文希望從目前的產(chǎn)業(yè)局面出發(fā),和大家一起思考AI計(jì)算的前行之路。
目前的局面
首先我們必須了解一個(gè)問(wèn)題,那就是為什么這次英偉達(dá)禁令出臺(tái)之后,大眾輿論與AI行業(yè)的反應(yīng)都沒(méi)有18、19年芯片封鎖剛開(kāi)始時(shí)嚴(yán)重。似乎只有在消費(fèi)級(jí)顯卡RTX 4090是否被禁問(wèn)題上,引發(fā)了游戲玩家和相關(guān)商家的一些爭(zhēng)論。
這背后的宏觀邏輯在于,行業(yè)是非常不愿意看到高端AI芯片被禁售的,但其實(shí)也對(duì)這種局面早有預(yù)料。一方面是美國(guó)對(duì)華芯片封鎖推動(dòng)多年,此前英偉達(dá)部分高端GPU已經(jīng)被禁,產(chǎn)業(yè)界的反饋早就從驚愕調(diào)整為了泰然處之。加上ChatGPT爆火之后今年全球高端GPU行情陡然看漲,隨之而來(lái)的是美國(guó)方面屢次表態(tài)要推動(dòng)對(duì)華整體性的高端AI芯片禁售。虛虛實(shí)實(shí)幾個(gè)月之后,最終落下一錘也不外如是。
為了應(yīng)對(duì)這次可預(yù)見(jiàn)的禁令,同時(shí)也有大模型發(fā)展的客觀推動(dòng),去年年底到今年上半年大量中國(guó)科技、金融、汽車等領(lǐng)域的企業(yè)集中囤貨英偉達(dá)高端GPU,已經(jīng)造成了市面上一卡難求的局面。換句話說(shuō),對(duì)于很多中國(guó)中小型科技企業(yè)、AI創(chuàng)業(yè)公司來(lái)說(shuō),高端GPU本就買不到,禁售之后并沒(méi)有太多改變。
另外一個(gè)真實(shí)情況是,高端AI芯片并非無(wú)法國(guó)產(chǎn)化。早在18、19年貿(mào)易摩擦開(kāi)始之后,國(guó)內(nèi)AI芯片產(chǎn)業(yè)加速發(fā)展。這就導(dǎo)致在AI訓(xùn)練需求上,英偉達(dá)高端GPU雖然很難被替代,但并非不可替代。
加上AI芯片并不像手機(jī)芯片那樣事關(guān)大眾消費(fèi)者,且華為已經(jīng)在手機(jī)芯片上完成了突破。種種跡象合在一起,導(dǎo)致無(wú)論是大眾還是行業(yè),都對(duì)這次禁令產(chǎn)生了一種坦然,甚至有點(diǎn)見(jiàn)怪不怪的心態(tài)。
但必須客觀看到的是,這次禁令絕非對(duì)中國(guó)AI行業(yè)沒(méi)有傷害。一方面短期內(nèi)更換英偉達(dá)GPU,無(wú)論在芯片產(chǎn)能、生態(tài)兼容性等問(wèn)題上都非常困難。并且禁令還將直接在AI服務(wù)器等領(lǐng)域,給大規(guī)模使用英偉達(dá)產(chǎn)品的廠商造成傷害。
而更關(guān)鍵的問(wèn)題在于未來(lái),如果禁令長(zhǎng)期存在,中國(guó)AI計(jì)算將逐漸與全球高端芯片脫鉤,那么可能帶來(lái)的長(zhǎng)期負(fù)面影響是非常復(fù)雜的,比如說(shuō):
1.英偉達(dá)高端GPU代表的AI芯片在更新迭代之后,是否會(huì)造成中國(guó)AI算力的發(fā)展脫節(jié)?
2.底層算力出現(xiàn)發(fā)展分歧后,中國(guó)AI產(chǎn)業(yè)是否會(huì)在大模型等軟件技術(shù)發(fā)展中掉隊(duì)?
3.本次AI芯片禁令,已經(jīng)呈現(xiàn)出大規(guī)模封鎖的特征。這種科技封鎖真的只會(huì)停留在AI芯片領(lǐng)域嗎?通用算力、存儲(chǔ)、基礎(chǔ)軟件等數(shù)字化基礎(chǔ)能力是否將成為接下來(lái)的打擊目標(biāo)?
總而言之,這次的AI芯片禁令,對(duì)中國(guó)來(lái)說(shuō)是一次有準(zhǔn)備的博弈,而非一場(chǎng)奇襲。想要成功度過(guò)這一關(guān),也需要將手中的每一張牌都打好,打出配合,從而降低傷害烈度,提升長(zhǎng)期發(fā)展的勝率。
而就目前來(lái)看,中國(guó)AI計(jì)算有三項(xiàng)必須同時(shí)發(fā)力的“突圍方案”。
方案1:用好“買家”身份
有個(gè)簡(jiǎn)單的道理,商業(yè)市場(chǎng)的行為邏輯是由供需決定的。但在以芯片為代表的中美科技貿(mào)易中,我們經(jīng)常會(huì)陷入一個(gè)思維誤區(qū):認(rèn)為絕大部分游戲規(guī)則是由美國(guó)政府和企業(yè)制定的,他們想賣我們就買,他們不想買我們就無(wú)奈。
作為全球芯片市場(chǎng)的最大“買家”,中國(guó)企業(yè)卻沒(méi)有話語(yǔ)權(quán),這是非?;闹嚨?。
事實(shí)上,針對(duì)中國(guó)市場(chǎng)的AI芯片禁令,最直接傷害的就是以英偉達(dá)為代表的美國(guó)科技巨頭。目前,英偉達(dá)AI芯片方面最大市場(chǎng)需求來(lái)自中國(guó)。此前英偉達(dá)CEO黃仁勛就明確表示,“如果被剝奪了中國(guó)市場(chǎng),我們是沒(méi)有應(yīng)急措施的,世界上沒(méi)有另一個(gè)中國(guó)”。
在這種情況下,我們能看到追求商業(yè)利益的美國(guó)科技公司,與追求政治利益的美國(guó)政府之間有著鮮明的矛盾。美國(guó)科技企業(yè)總是想方設(shè)法尋求反對(duì)禁令和繞過(guò)禁令,比如英偉達(dá)就從去年開(kāi)始推出了應(yīng)對(duì)禁運(yùn)政策的中國(guó)特供版GPU。
中國(guó)市場(chǎng),消化了美國(guó)科技企業(yè)約三分之一的產(chǎn)能,二者之間的供需紐帶是無(wú)法長(zhǎng)期割裂的。面對(duì)美國(guó)愈發(fā)明顯的整體性科技封禁,中國(guó)市場(chǎng)也應(yīng)該積極用好“買家”身份,讓自身的行為更具鮮明立場(chǎng)與可預(yù)測(cè)性。
避免造成一種“賣了就歡迎,不賣只能無(wú)奈”的表現(xiàn)和印象。
“買家身份”應(yīng)該是一種有立場(chǎng)、有力量且會(huì)憤怒的身份。
方案2:以云代卡,算力集中
在可見(jiàn)的較長(zhǎng)時(shí)間里,美國(guó)對(duì)中國(guó)的AI芯片封禁恐怕都只會(huì)加強(qiáng),而這個(gè)時(shí)機(jī)恰好對(duì)應(yīng)上AI大模型發(fā)展的關(guān)鍵階段。很多業(yè)內(nèi)人士認(rèn)為,大模型發(fā)展雖快,但沒(méi)有呈現(xiàn)出此前其他科技風(fēng)口的迅猛局面,投資缺錢,計(jì)算缺卡是主要原因。
那么如何解決中國(guó)AI產(chǎn)業(yè)在禁令之下的算力缺口問(wèn)題呢?首先的應(yīng)急方案就是企業(yè)加大云端AI算力的配置和投入,推進(jìn)以云代卡。
事實(shí)上,在高端AI芯片可能被禁的大趨勢(shì)下,中國(guó)幾大公有云廠商都做出了加強(qiáng)囤積英偉達(dá)高端GPU的動(dòng)作。這一方面是因?yàn)樵茝S商自身要加大大模型投入,打開(kāi)MaaS市場(chǎng),所以對(duì)AI算力有直接需求。另一方面也是因?yàn)镚PU轉(zhuǎn)化為云資源池之后可以長(zhǎng)期復(fù)用,對(duì)于云廠商來(lái)說(shuō)是一個(gè)進(jìn)可攻,退可守的局面。因此,今年上半年一度出現(xiàn)了市面上高端AI芯片全都流向云廠商,中小企業(yè)一卡難求的局面。
客觀來(lái)看,這種高端AI芯片集中向云的舉動(dòng),對(duì)整個(gè)中國(guó)市場(chǎng)統(tǒng)籌應(yīng)對(duì)AI芯片禁令是有利的,并且也符合東數(shù)西算的戰(zhàn)略思路。
另一個(gè)利好云端AI算力的趨勢(shì)在于,隨著大模型參數(shù)和使用數(shù)據(jù)量的不斷加大。本地化的卡池訓(xùn)練已經(jīng)愈發(fā)吃緊。必須在云端發(fā)生的千卡、萬(wàn)卡訓(xùn)練成為未來(lái)主要的發(fā)展方向,因此企業(yè)用戶天然會(huì)更積極走向云端。
同時(shí),云端AI算力也不會(huì)僅僅停留在囤積英偉達(dá)GPU的層面。接下來(lái),國(guó)產(chǎn)的自主AI算力駛?cè)朐贫耸谴髣?shì)所趨。在相關(guān)政策的推動(dòng)下,云廠商正在加大自主AI芯片的采購(gòu)力度。根據(jù)IDC數(shù)據(jù),2023年上半年中國(guó)AI服務(wù)器已經(jīng)使用了50萬(wàn)塊自主開(kāi)發(fā)的AI加速器芯片。在自主AI算力的服務(wù)化方面,華為云已經(jīng)推出了昇騰AI云服務(wù)。云端化與自主化結(jié)合的AI算力,將在AI芯片禁令背景下得到極大發(fā)展。
加上近些年在東數(shù)西算大背景下,各地陸續(xù)建立了大量采用自主AI算力的AI計(jì)算中心,整體來(lái)看中國(guó)的云端AI算力是供給穩(wěn)定、保障可靠的。
而很多企業(yè)依舊傾向于采購(gòu)本地AI算力。這一方面是因?yàn)橛ミ_(dá)GPU市場(chǎng)緊缺,保值性特別好,甚至能作為企業(yè)的核心資產(chǎn)。另一方面是因?yàn)樵贫薃I算力往往會(huì)有排隊(duì)、宕機(jī)、軟件服務(wù)缺失等問(wèn)題。
如何進(jìn)一步提高開(kāi)發(fā)者的云端AI算力使用體驗(yàn),是公有云廠商接下來(lái)需要發(fā)力的方向。
方案3:讓國(guó)產(chǎn)AI算力爆發(fā)式成長(zhǎng)
面對(duì)新一輪AI芯片禁令,中國(guó)AI產(chǎn)業(yè)最大的底氣是什么?是多年之后的習(xí)以為常,還是大量屯卡之后的家有余糧?都不是。最關(guān)鍵的節(jié)點(diǎn)在于經(jīng)過(guò)多年發(fā)展,中國(guó)AI芯片產(chǎn)業(yè)已經(jīng)得到了巨大發(fā)展。英偉達(dá)的高端GPU確實(shí)依舊重要,但已經(jīng)不是毫無(wú)替代選項(xiàng)可言。
根據(jù)IDC此前發(fā)布的數(shù)據(jù),2022年中國(guó)AI加速卡出貨量約為109萬(wàn)張,其中英偉達(dá)市場(chǎng)份額達(dá)到了85%,華為昇騰實(shí)市場(chǎng)占有率10%,百度昆侖為2%,寒武紀(jì)和燧原科技均為1%。
從中可以看出,國(guó)產(chǎn)AI算力已經(jīng)實(shí)現(xiàn)了一定程度的市場(chǎng)占比,而不僅僅是概念與理論中的“紙上談兵”。同時(shí)也應(yīng)該看到,國(guó)產(chǎn)AI芯片在核心性能、軟件生態(tài)以及出貨能力上依舊不理想,還有很長(zhǎng)的路要走。在英偉達(dá)禁令的客觀條件倒逼下,國(guó)產(chǎn)AI算力必須在短期內(nèi)跨越這些困難,加速自身的成長(zhǎng)與成熟周期。
為了實(shí)現(xiàn)這個(gè)目標(biāo),有幾件事非常重要:
1.形成產(chǎn)業(yè)共識(shí),避免概念混淆。
提起AI芯片,我們經(jīng)常會(huì)說(shuō)它有非常多的實(shí)現(xiàn)方式,有很多自主品牌參與這個(gè)市場(chǎng),看上去一片繁榮。比如AI芯片有GPU、FPGA、ASIC、存算一體和類腦芯片等,國(guó)產(chǎn)AI加速芯片廠商有阿里、百度、華為、寒武紀(jì)、海光信息、燧原科技、天數(shù)智芯、壁仞科技、摩爾線程、龍芯中科等。
這種“繁榮”的表述,不僅在大眾輿論和投資市場(chǎng)上具有迷惑性,還經(jīng)常出現(xiàn)在一些行業(yè)報(bào)告與政策分析當(dāng)中。但其中蘊(yùn)藏的問(wèn)題在于,普遍過(guò)分拓展了AI芯片的定義。比如說(shuō),類腦芯片在可見(jiàn)的未來(lái)中都僅僅是技術(shù)暢想,如果每次討論國(guó)產(chǎn)AI芯片都把類腦加上,那只會(huì)浪費(fèi)時(shí)間,分散精力。再比如,有些AI芯片廠商只能做自用芯片,無(wú)法面向市場(chǎng)出貨。有些廠商目前還不具備商業(yè)化能力,處在早期建設(shè)階段,他們短期內(nèi)對(duì)于AI計(jì)算自主化的貢獻(xiàn)也就非常之小。
為了應(yīng)對(duì)英偉達(dá)高端GPU禁售問(wèn)題,我們需要把目光集中在可行、有效的GPU替代品上,而不是進(jìn)行過(guò)多聯(lián)想和發(fā)散。只有形成了這一產(chǎn)業(yè)共識(shí),才能聚集力量解決問(wèn)題。
2.走向規(guī)?;逃?,避免PPT造芯。
事實(shí)上,無(wú)論從AI加速芯片還是服務(wù)器整機(jī)來(lái)看,國(guó)內(nèi)目前能夠出貨的AI芯片廠商都寥寥無(wú)幾。主要集中在華為、百度兩家,燧原科技、海光信息也有一定的出貨。而大量半導(dǎo)體廠商與AI企業(yè),更多還停留在打造芯片的計(jì)劃與愿景上。這就導(dǎo)致大量受到政策支持與投資市場(chǎng)期待的國(guó)產(chǎn)AI芯片停滯不前,甚至有停留在這一階段享受金融市場(chǎng)紅利的嫌疑。
接下來(lái)的產(chǎn)業(yè)導(dǎo)向,應(yīng)該從AI芯片的立項(xiàng)走向出貨,幫助AI芯片廠商獲得直接的商業(yè)回饋,產(chǎn)品與產(chǎn)能接受市場(chǎng)檢驗(yàn),逐步塑造正向的現(xiàn)金流。
3.加強(qiáng)軟件生態(tài),強(qiáng)化遷移能力。
英偉達(dá)GPU之所以重要,不僅在于硬件性能,更在以CUDA、PyTorch為核心的軟件生態(tài)能力,因此發(fā)展國(guó)產(chǎn)AI芯片絕不能低估軟件的能力。在強(qiáng)化自主軟件生態(tài)建設(shè)的同時(shí),也要重視基于英偉達(dá)生態(tài)打造AI模型的遷移能力與遷移成本。
為此,已經(jīng)有大量廠商進(jìn)行了探索,比如海光信息的DCU,就在生態(tài)、編程環(huán)境等方面與CUDA高度相似,CUDA用戶可以以較低代價(jià)快速遷移至海光的ROCm平臺(tái)。而在此前,PyTorch2.1 版本宣布支持華為昇騰??梢?jiàn)國(guó)產(chǎn)AI芯片已經(jīng)具備了一定的規(guī)?;绊懥Γ梢愿嗳谌肴蜍浖鷳B(tài)當(dāng)中。
未來(lái)想要實(shí)現(xiàn)國(guó)產(chǎn)AI計(jì)算的爆發(fā),是無(wú)法離開(kāi)國(guó)產(chǎn)AI基礎(chǔ)軟件生態(tài)爆發(fā)的。
4、加大對(duì)“主品牌”支持,形成規(guī)模化效應(yīng)。
對(duì)于美國(guó)AI芯片,除了英偉達(dá)GPU,你還知道哪些?這個(gè)問(wèn)題即使是問(wèn)一些AI開(kāi)發(fā)者,答案也很大程度是不清楚,或者沒(méi)試過(guò)。從中可見(jiàn),AI計(jì)算就像通用計(jì)算、圖形計(jì)算一樣,極大概率是會(huì)最終出現(xiàn)一到兩個(gè)“主品牌”的。這屬于客觀的市場(chǎng)規(guī)律,沒(méi)有必要以揠苗助長(zhǎng)的方式實(shí)現(xiàn)“百花齊放”的局面。
甚至就目前中國(guó)AI計(jì)算必須加速成熟,完成自主化替代的目標(biāo)來(lái)說(shuō),盡快實(shí)現(xiàn)一超多強(qiáng)的局面是件好事。這可以避免生態(tài)割裂,避免產(chǎn)業(yè)在搖擺形成大量IT投資浪費(fèi)。這個(gè)過(guò)程理應(yīng)交給市場(chǎng)選擇,慢慢成型。但在芯片禁令的大背景下,國(guó)產(chǎn)AI計(jì)算崛起已經(jīng)時(shí)不我待,與其讓100種AI芯片慢慢成熟,慢慢洗牌,比如加速形成“主品牌”快速替代的局面。
而從目前局面看,昇騰是最有可能成為國(guó)產(chǎn)AI算力主品牌的一支力量??拼笥嶏w創(chuàng)始人、董事長(zhǎng)劉慶峰此前表示,華為GPU已經(jīng)對(duì)標(biāo)英偉達(dá)A100。根據(jù)數(shù)據(jù)顯示,昇騰310整數(shù)精度算力達(dá)到了16TOPS,昇騰910整數(shù)精度算力達(dá)到640TOPS。這意味著昇騰910性能已經(jīng)接近英偉達(dá)A100。
同時(shí),昇騰也是目前唯一穩(wěn)定占據(jù)市場(chǎng)份額的國(guó)產(chǎn)AI算力,并且在軟件上孵化了類似英偉達(dá)CUDA的異構(gòu)計(jì)算架構(gòu)CANN和AI計(jì)算框架MindSpore。在核心性能、軟件生態(tài)與市場(chǎng)占有率三項(xiàng)指標(biāo)來(lái)看,昇騰都已經(jīng)具備了可以加快成長(zhǎng),實(shí)現(xiàn)AI算力大規(guī)模國(guó)產(chǎn)化替代的可行性。
規(guī)范行業(yè)標(biāo)準(zhǔn),強(qiáng)化軟件建設(shè),提高自主品牌支持,是短期內(nèi)推動(dòng)國(guó)產(chǎn)AI算力快速成長(zhǎng)的主要途徑。
英偉達(dá)禁令,是一個(gè)中國(guó)AI行業(yè)普遍不愿意看到,盡量避免,甚至到今天也有些諱莫如深的問(wèn)題。但形勢(shì)比人強(qiáng),在不斷加速的逆全球化進(jìn)程與AI競(jìng)賽中,類似禁令未來(lái)大概率只多不少。
逃避、迂回、噤若寒蟬,都無(wú)法解決問(wèn)題,只有坦然應(yīng)對(duì),奮力自強(qiáng),才能從根本上解決受制于人的問(wèn)題。
禁令之下,中國(guó)AI計(jì)算何去何從?
答案是我們已別無(wú)選擇,所以要給世界第二個(gè)選擇。
