高端GPU被禁售,加快突破GPU芯片成產(chǎn)業(yè)重要目標(biāo)
近日,工業(yè)和信息化部、教育部、科技部、交通運(yùn)輸部、文化和旅游部、國務(wù)院國資委、中國科學(xué)院等七部門近日聯(lián)合印發(fā)《關(guān)于推動(dòng)未來產(chǎn)業(yè)創(chuàng)新發(fā)展的實(shí)施意見》(以下簡稱“《意見》”)。
《意見》提出,到2025年,我國未來產(chǎn)業(yè)技術(shù)創(chuàng)新、產(chǎn)業(yè)培育、安全治理等全面發(fā)展,部分領(lǐng)域達(dá)到國際先進(jìn)水平,產(chǎn)業(yè)規(guī)模穩(wěn)步提升。建設(shè)一批未來產(chǎn)業(yè)孵化器和先導(dǎo)區(qū),突破百項(xiàng)前沿關(guān)鍵核心技術(shù),形成百項(xiàng)標(biāo)志性產(chǎn)品,初步形成符合我國實(shí)際的未來產(chǎn)業(yè)發(fā)展模式。到2027年,未來產(chǎn)業(yè)綜合實(shí)力顯著提升,部分領(lǐng)域?qū)崿F(xiàn)全球引領(lǐng)。關(guān)鍵核心技術(shù)取得重大突破,一批新技術(shù)、新產(chǎn)品、新業(yè)態(tài)、新模式得到普遍應(yīng)用,形成可持續(xù)發(fā)展的長效機(jī)制,成為世界未來產(chǎn)業(yè)重要策源地。
《意見》從全面布局未來產(chǎn)業(yè)、加快技術(shù)創(chuàng)新和產(chǎn)業(yè)化、打造標(biāo)志性產(chǎn)品、壯大產(chǎn)業(yè)主體、豐富應(yīng)用場景、優(yōu)化產(chǎn)業(yè)支撐體系六個(gè)方面規(guī)劃重點(diǎn)任務(wù)。
在全面布局未來產(chǎn)業(yè)方面,《意見》提出要加強(qiáng)前瞻謀劃部署。把握全球科技創(chuàng)新和產(chǎn)業(yè)發(fā)展趨勢,重點(diǎn)推進(jìn)未來制造、未來信息、未來材料、未來能源、未來空間和未來健康六大方向產(chǎn)業(yè)發(fā)展。實(shí)施意見列舉了包括人形機(jī)器人、腦機(jī)接口、超大規(guī)模新型智算中心、第三代互聯(lián)網(wǎng)等創(chuàng)新標(biāo)志性產(chǎn)品。其中,關(guān)于超大規(guī)模新型智算中心部分提到,加快突破GPU芯片、集群低時(shí)延互連網(wǎng)絡(luò)、異構(gòu)資源管理等技術(shù),建設(shè)超大規(guī)模智算中心,滿足大模型迭代訓(xùn)練和應(yīng)用推理需求。
人工智能與GPU互相成就
最初,并不是GPU選擇了人工智能,而是人工智能的研究者選擇了GPU,進(jìn)而成就了GPU:2012年Alex Krizhevsky(前谷歌計(jì)算機(jī)科學(xué)家)利用深度學(xué)習(xí)+GPU的方案,一舉贏得Image Net LSVRC-2010 圖像識(shí)別大賽,并奇跡般地將識(shí)別成功率從74%提升到85%。
NVIDIA敏銳地洞察到了這一趨勢,于是耗費(fèi)巨大的人力物力優(yōu)化基于自家GPU的CUDA深度學(xué)習(xí)生態(tài)系統(tǒng),在三年時(shí)間里將GPU性能提升了65倍,并提供基于其GPU的從后端模型訓(xùn)練到前端推理應(yīng)用的全套深度學(xué)習(xí)解決方案,使得一般的開發(fā)人員都可以非常容易地使用GPU進(jìn)行深度學(xué)習(xí)開發(fā)或高性能運(yùn)算,從而奠定了其目前的王者之位。
GPU是AI時(shí)代的算力核心,但AI算力的構(gòu)成不僅僅只是GPU加速芯片,還需要構(gòu)建包括網(wǎng)絡(luò)互聯(lián)、操作系統(tǒng)、深度學(xué)習(xí)框架及相應(yīng) SDK、算法與應(yīng)用程序等,形成一個(gè)完整的計(jì)算生態(tài)系統(tǒng)。
可以說,是人工智能和GPU互相成就了對方:人工智能算法促進(jìn)GPU的發(fā)展,而GPU也讓算法更加簡單。
大語言模型助推 GPU 算力需求增長
市場對 3D 圖像處理和 AI 深度學(xué)習(xí)計(jì)算等需求不斷增加,GPU 市場保持高增 速。據(jù) Global Market Insights 的數(shù)據(jù),全球 GPU 市場預(yù)計(jì)將以 CAGR 25.9%持 續(xù)增長,至 2030 年達(dá)到 4000 億美元規(guī)模。在 GPU 市場中,NVIDIA 依靠在深 度學(xué)習(xí)、人工智能等領(lǐng)域布局的先發(fā)優(yōu)勢并憑借其優(yōu)異產(chǎn)品性能以及成熟的生態(tài) 平臺(tái)長期處于領(lǐng)導(dǎo)地位,根據(jù) JPR 數(shù)據(jù),2022 年 Q1,NVIDIA 的在獨(dú)顯市場份 額約為 78%。
大語言模型有望拉動(dòng) GPU 需求增量,我們測算 23/24/25 年大模型有望貢獻(xiàn) GPU 市場增量 69.88/166.2/209.95 億美元。具體假設(shè)測算如下: 訓(xùn)練端,近年來各大廠商陸續(xù)發(fā)布大模型,我們假設(shè) 23/24/25 年新增 5/10/15 個(gè) 大模型,根據(jù) OpenAI 團(tuán)隊(duì)于 2020 發(fā)表的論文《Scaling Laws for Neural Language Models》提出的計(jì)算方法,對于以 Transformer 為基礎(chǔ)的模型,假設(shè)模 型參數(shù)量為 N,單 Token 所需的訓(xùn)練算力約為 6N。參考 OpenAI 團(tuán)隊(duì) 2020 同年 發(fā)表的論文《Language Models are Few-Shot Learners》,GPT-3 模型參數(shù)量約為 1750 億個(gè),Token 數(shù)量約為 3000 億個(gè),近年發(fā)布的模型均在千億級(jí)參數(shù)級(jí)別, 因此我們中性假設(shè) 23 年新增大模型平均參數(shù)量約為 2000 億個(gè),Token 數(shù)量約為 3000 億個(gè),兩者后續(xù)每年以 20%增速增加。另外假設(shè)單次訓(xùn)練耗時(shí)約 30 天,算 力效率為 30%,后續(xù)伴隨算法精進(jìn),算力效率預(yù)計(jì)逐漸提升。以目前主流的訓(xùn)練 端 GPU 英偉達(dá) A100 測算,假設(shè) ASP 為 1 萬美元,23/24/25 年全球訓(xùn)練端 GPU 需求市場規(guī)模預(yù)計(jì)分別為 0.74/2.00/4.07 億美元。
推理端,基于訓(xùn)練端的假設(shè),根據(jù)論文《Scaling Laws for Neural Language Models》,單 Token 所需的推理算力開銷約為 2N。則對于 GPT-3 模型,其單 Token 所需的推理算力開銷為 3500 億 FLOPs-S。假設(shè)單次最大查詢 Tokens 數(shù)為 1000(對應(yīng)漢字約 300-500 字,英文約 750 詞),每人每天查詢 20 次。在并發(fā)用 戶數(shù)的估計(jì)上,我們參考國際主流社交媒體日活用戶數(shù)進(jìn)行測算,根據(jù) Dustin Stout 統(tǒng)計(jì),F(xiàn)acebook、WhatsApp、Instagram 全球日活用戶數(shù)分別為 16 億、10 億、6 億,考慮到目前(類) GPT 平臺(tái)仍處于發(fā)展早期,我們預(yù)計(jì)全球大模型日活 用戶數(shù)在 23/24/25 分別為 2/6/10 億,按照所有用戶平均分布于 24 小時(shí),并以 10 倍計(jì)算峰值并發(fā)數(shù)量。以目前英偉達(dá)用于推理端計(jì)算的 A10 測算,假設(shè) ASP 為 2800 美元,23/24/25 年全球推理端 GPU 需求市場規(guī)模預(yù)計(jì)分別為 69.14/164.2/205.88 億美元。
英偉達(dá)GPU遇冷,國產(chǎn)芯片崛起
AI芯片市場格局迎來逆轉(zhuǎn)。英偉達(dá)GPU曾備受追捧,但如今卻遭遇冷遇。騰訊、阿里等國內(nèi)巨頭紛紛轉(zhuǎn)向國產(chǎn)芯片,國產(chǎn)芯片廠商迎來春天。
原因在于,英偉達(dá)GPU價(jià)格高昂,且存在性能過剩問題。國產(chǎn)芯片性價(jià)比更高,且更適合國內(nèi)應(yīng)用場景。隨著國產(chǎn)芯片技術(shù)的不斷成熟,其性能已足以滿足主流應(yīng)用需求。
這一轉(zhuǎn)變標(biāo)志著國產(chǎn)芯片產(chǎn)業(yè)的崛起,也預(yù)示著AI芯片市場格局的深刻變化?!坝ミ_(dá)“閹割版”GPU遇冷,騰訊、阿里等轉(zhuǎn)頭擁抱國產(chǎn)?”,AI芯片戰(zhàn)局似乎迎來逆轉(zhuǎn)!此前每次英偉達(dá)的顯卡一經(jīng)推出,無不受到國內(nèi)各大公司爭搶,但現(xiàn)如今,情況似乎發(fā)生了逆轉(zhuǎn):
中國科技巨頭,如百度、阿里巴巴、騰訊和字節(jié)跳動(dòng),正在削減對英偉達(dá)芯片訂單,轉(zhuǎn)向國產(chǎn)芯片供應(yīng)商或內(nèi)部自研芯片。顯卡大戶中國的決定,對英偉達(dá)收入的影響不容忽視,這占英偉達(dá)1/5的營收。此舉也反映出中國企業(yè)在芯片供應(yīng)鏈自主可控的戰(zhàn)略考量。1/5收入的中國科技公司,包括百度、阿巴、騰訊和字節(jié)等公司正在開始減少英偉達(dá)芯片的訂單量,轉(zhuǎn)向國內(nèi)芯片制造商或者公司內(nèi)部自研芯片。
顯而易見,這“得益于”漂亮國的對華AI芯片禁售政策。
隨著美國收緊芯片管制,中國云計(jì)算企業(yè)將減少對英偉達(dá)的依賴,轉(zhuǎn)向本土芯片供應(yīng)商。 TrendForce 分析師 Frank Kung 表示,中國云計(jì)算企業(yè)目前約 80% 的高端人工智能芯片來自 Nvidia,未來五年這一比例可能會(huì)下降至 50%-60%。他補(bǔ)充說,未來美國收緊芯片管制將對英偉達(dá)在中國的銷售造成額外壓力。
在AI芯片領(lǐng)域,國內(nèi)供應(yīng)商能否滿足需求方的實(shí)際應(yīng)用需求尚待驗(yàn)證。國內(nèi)云計(jì)算廠家的轉(zhuǎn)單決心也仍不明確。因此,在短期內(nèi),自建算力仍將是企業(yè)的主要選擇。
國內(nèi)AI芯片與需求方實(shí)際應(yīng)用需求之間存在差距,導(dǎo)致企業(yè)轉(zhuǎn)單意愿不強(qiáng)。而云計(jì)算廠家的轉(zhuǎn)單決心也受到多種因素的影響,包括成本、性能、兼容性等。在這些問題得到解決之前,企業(yè)自建算力仍將是大勢所趨。,目前在國內(nèi)培養(yǎng)本土供應(yīng)鏈的呼聲顯然更高。不過,愿望和實(shí)際操作是兩回事,當(dāng)前國內(nèi)的AI芯片能滿足需求方們實(shí)際應(yīng)用的需求嗎?國內(nèi)云計(jì)算廠家的轉(zhuǎn)單決心又有多堅(jiān)定,還有待考驗(yàn)。
