AI芯片紅利實(shí)在太誘人,科技巨頭們能威脅英偉達(dá)的地位嗎?
關(guān)鍵詞: AI芯片 臺(tái)積電 英偉達(dá)
科技巨頭谷歌、Meta、英特爾紛紛推出最新款A(yù)I芯片,全力追趕英偉達(dá),本輪AI競賽愈發(fā)激烈。
Meta:官宣下一代AI訓(xùn)練與推理芯片項(xiàng)目(MTIA)
4月10日消息,Meta Platforms宣布推出其訓(xùn)練與推理加速器項(xiàng)目(MTIA)的最新版本。據(jù)悉,MTIA是Meta專門為AI工作負(fù)載設(shè)計(jì)的定制芯片系列,Meta的目標(biāo)是通過一系列產(chǎn)品迭代降低對英偉達(dá)等公司的依賴。
據(jù)Meta介紹,新一代AI芯片由臺(tái)積電代工,采用5納米工藝制程。MTIA也是該公司更廣泛產(chǎn)品開發(fā)的一部分,針對Meta獨(dú)特的工作負(fù)載和系統(tǒng)進(jìn)行了優(yōu)化。與前一個(gè)版本相比,新的MTIA在計(jì)算能力和內(nèi)存帶寬上都提高了一倍多,有助于強(qiáng)化內(nèi)容排名和推薦廣告模型。
去年10月,Meta表示,將在支持AI的基礎(chǔ)設(shè)施上投入多達(dá)350億美元,包括數(shù)據(jù)中心和硬件。首席執(zhí)行官扎克伯格表示,到2024年,AI將成為Meta最大的投資領(lǐng)域。近日Meta表示,該公司不僅要投資于計(jì)算芯片,還要投資于內(nèi)存帶寬、網(wǎng)絡(luò)、容量以及其他下一代硬件系統(tǒng)。
谷歌:推出Arm架構(gòu)AI芯片Axion
4月9日,谷歌谷歌宣布推出了為數(shù)據(jù)中心設(shè)計(jì)的、基于Arm架構(gòu)定制的新型CPU“谷歌Axion”,以期降低云計(jì)算的運(yùn)營成本,并表示其性能優(yōu)于x86芯片以及云端通用Arm芯片。
根據(jù)谷歌云內(nèi)部數(shù)據(jù)顯示,與通用Arm芯片相比,Axion提供的實(shí)例性能高出了30%;而與當(dāng)代基于x86的同類處理器相比,Axion的性能高出50%,能效高出60%。預(yù)計(jì)這款芯片將于今年晚些時(shí)候上市。通過推出基于Arm的定制芯片,谷歌也希望能讓其云計(jì)算業(yè)務(wù)更加經(jīng)濟(jì)適用,以此來和亞馬遜以及微軟競爭。
官方數(shù)據(jù)顯示,谷歌母公司目前Alphabet有四分之三的收入來自廣告,但其云計(jì)算部門的增長很快,已占到總收入的11%。
英特爾:發(fā)布新一代AI芯片Gaudi 3 AI加速卡
4月9日,英特爾在 Vision 2024 客戶和合作伙伴大會(huì)上正式宣布推出最新的芯片產(chǎn)品 Gaudi 3 AI加速卡。
據(jù)悉,Gaudi系列是英特爾在2022年5月面向人工智能應(yīng)用場景專門推出的芯片品牌,用以對標(biāo)英偉達(dá)的人工智能計(jì)算芯片。英特爾表示,Gaudi 3 芯片的能源效率是英偉達(dá)H100型號GPU的兩倍多,而運(yùn)行速度是H100的1.5倍,預(yù)計(jì)該芯片將在今年第三季度推出。
官方資料顯示,英特爾Gaudi 3采用5nm工藝,帶寬是前代Gaudi 2(7nm工藝)的1.5倍,BF16功率是其4倍。Gaudi 3配備最高128GB的HBM2e內(nèi)存,峰值帶寬為 3.7TB/s。
在該活動(dòng)現(xiàn)場,英特爾還圍繞人工智能面向企業(yè)發(fā)布了處理器Xeon 6以及AI 開發(fā)開放平臺(tái)計(jì)劃等產(chǎn)品和方案。英特爾一直致力于通過力推AI在個(gè)人電腦終端的落地來反向促進(jìn)自家上游硬件生態(tài)的繁榮。去年9月,英特爾首席執(zhí)行官帕特·基辛格首次提出AI PC這一概念。當(dāng)時(shí),基辛格指出AI將通過云與PC緊密協(xié)作,進(jìn)而從根本上改變、重塑和重構(gòu)PC體驗(yàn),釋放人們的生產(chǎn)力和創(chuàng)造力。
英偉達(dá)真的危險(xiǎn)了嗎?黃仁勛:依然很穩(wěn)
那么,前有谷歌、微軟、亞馬遜“造芯”,后有英特爾“彎道超車”,英偉達(dá)真的危險(xiǎn)了嗎?
2023年12月初,AMD高調(diào)推出了MI300系列產(chǎn)品。據(jù)介紹,MI300X芯片擁有超過1500億個(gè)晶體管,內(nèi)存密度是目前英偉達(dá)H100的2.4倍,內(nèi)存帶寬是其1.6倍。AMD首席執(zhí)行官蘇姿豐稱,這款新芯片在訓(xùn)練 AI 軟件的能力方面與英偉達(dá)的H100相當(dāng),并且在推理方面表現(xiàn)得更好,不過這一說法也未得到獨(dú)立驗(yàn)證。
今年3月底,英偉達(dá)正式發(fā)布了新一代人工智能計(jì)算芯片B200。英偉達(dá)CEO黃仁勛表示,B200 GPU的AI運(yùn)算性能在FP8及新的FP6上都可達(dá)20 petaflops,是前一代H100運(yùn)算性能的2.5倍。
如今,隨著Gaudi 3的正式發(fā)布,當(dāng)前AI芯片市場呈現(xiàn)出英偉達(dá)B200、AMD MI300系列和英特爾Gaudi 3"三巨頭"競爭的格局。英偉達(dá)在AI芯片領(lǐng)域"一家獨(dú)大"的局面面臨來自另外兩家廠商的挑戰(zhàn)。
不過,從黃仁勛角度來看,英偉達(dá)的生態(tài)系統(tǒng)很穩(wěn)定,在當(dāng)前AI算力"軍備競賽"中,英偉達(dá)依舊暫時(shí)是市場的佼佼者。
黃仁勛前段時(shí)間這段話其實(shí)表達(dá)的非常明確:“數(shù)據(jù)中心需要你運(yùn)營它。購買和銷售芯片的人考慮的是芯片價(jià)格。運(yùn)營數(shù)據(jù)中心的人考慮的是成本,我們總擁有成本(TCO)非常好。即使競爭對手芯片是免費(fèi)的,他們也不如我們,客戶也不會(huì)買。我們的目標(biāo)是增加更多的價(jià)值。但這背后需要很多努力,我們必須不斷創(chuàng)新、我們不能把任何事情視為理所當(dāng)然、我們有很多競爭對手。”
事實(shí)上,AI 芯片是一個(gè)不斷向前“奔跑”的高技術(shù)行業(yè)。它沒有壟斷,只有不斷創(chuàng)新提供更大價(jià)值,才有可能讓企業(yè)持續(xù)保持領(lǐng)先地位。因此,無論是英偉達(dá)還是英特爾,他們都有非常強(qiáng)大的市場競爭力,也都有望成為 AI 加速計(jì)算市場的“領(lǐng)先者”。
如今,在服務(wù)器市場,AMD正在逐漸蠶食該公司的市場份額。據(jù)市場調(diào)研機(jī)構(gòu)Mercury Research所公布的2023年第四季度AMD處理器市場份額統(tǒng)計(jì)數(shù)據(jù),AMD EPYC已經(jīng)拿下了23.1%服務(wù)器市場份額,份額占比再次擴(kuò)大。盡管EPYC作為通用處理器,算力上不如GPU加速器,不過該產(chǎn)品可與GPU加速器、AI加速器等協(xié)同工作,實(shí)現(xiàn)效率的最大化。
而全新英特爾 AI 芯片Gaudi,預(yù)計(jì)將不太會(huì)在中國大陸市場銷售。但從全球來看,它是否真的能如其所言的,憑借性能優(yōu)勢、極具競爭力定價(jià)優(yōu)勢而占領(lǐng)更大的市場份額,一切還有待時(shí)間的檢測。
無芯片,不AI
AI芯片是AI算力的核心。
有說法稱,對標(biāo)ChatGPT,做好一個(gè)大模型的最低門檻就是1萬塊A100的芯片。前面說到,隨著人工智能應(yīng)用場景和數(shù)據(jù)規(guī)模的擴(kuò)大,算法模型的復(fù)雜度呈指數(shù)級增長,特別是深度學(xué)習(xí)成為主流,需要更快的計(jì)算速度。雖然CPU可以執(zhí)行AI算法,但由于內(nèi)部邏輯多,對于AI算法來說效率不高。因此,出現(xiàn)了專門的AI芯片,它們設(shè)計(jì)用于高效并行計(jì)算,加速AI計(jì)算過程,并提高性價(jià)比。
廣義而言,AI 芯片指的是專門用于處理人工智能應(yīng)用中大量計(jì)算任務(wù)的模塊,除了以 GPU、FPGA、ASIC 為代表的 AI 加速芯片,還有比較前沿性的研究,例如:類腦芯片、可重構(gòu)通用 AI 芯片等。狹義的 AI 芯片指的是針對人工智能算法做了特殊加速設(shè)計(jì)的芯片。
這里面,GPU是AI芯片主力軍,因?yàn)樗鼡碛凶吭降母咝阅苡?jì)算能力和通用性,適用于處理復(fù)雜算法和通用型人工智能平臺(tái)。而隨著人工智能技術(shù)、平臺(tái)和終端的不斷成熟,隨著視覺、語音、深度學(xué)習(xí)的算法在FPGA以及ASIC芯片上的不斷優(yōu)化,此兩者也有望逐步占有更多的市場份額。
根據(jù)VMR數(shù)據(jù),全球和中國的GPU市場規(guī)模預(yù)計(jì)將繼續(xù)快速增長。2021年全球GPU市場規(guī)模達(dá)到334.7億美元,預(yù)計(jì)到2030年將增至4773.7億美元,年復(fù)合增長率達(dá)34.4%。2020年中國GPU市場規(guī)模為47.39億美元,預(yù)計(jì)到2027年將增至345.57億美元,年復(fù)合增長率為32.8%。這表明GPU在人工智能領(lǐng)域的需求將繼續(xù)擴(kuò)大,并將成為市場的重要推動(dòng)力量。
尋找中國版英偉達(dá),期待國產(chǎn)替代空間
對于AI在下一輪科技革命中的地位,各國已經(jīng)形成共識,都在紛紛搶灘。從中美對比來說,競爭優(yōu)勢的爭奪就主要涉及前面提到的算法、大數(shù)據(jù)資源和算力三方面。在算法設(shè)計(jì)方面,雙方?jīng)]有明顯差距,主要依賴設(shè)計(jì)團(tuán)隊(duì)的智慧和靈感;在大數(shù)據(jù)資源方面,中國占據(jù)著絕對優(yōu)勢,雙方在大數(shù)據(jù)分析技術(shù)上相近。然而,決定人工智能產(chǎn)品的關(guān)鍵要素還包括“算力",計(jì)算能力是計(jì)算機(jī)的核心能力,這也是中美兩國長期競爭超級計(jì)算機(jī)領(lǐng)域的原因之一。國內(nèi)大模型與國外的主要差距也體現(xiàn)在算力層面,沒有算力基礎(chǔ),后面算法等發(fā)展都無法進(jìn)行。
在AI芯片領(lǐng)域,國外的芯片巨頭占據(jù)了大部分市場份額,有著明顯的先發(fā)優(yōu)勢,比如英偉達(dá)、AMD、英特爾的營收幾乎代表整個(gè)GPU行業(yè)收入。而國內(nèi)的AI芯片產(chǎn)業(yè)起步較晚,與世界先進(jìn)水平存在較大差距,國內(nèi)AI芯片市場也較為分散,集中度較低,發(fā)展空間巨大。
不過,國內(nèi)一批新興力量正在崛起,競爭梯隊(duì)越發(fā)豐富。從國內(nèi)AI芯片廠商格局來看,以大算力或者高性能計(jì)算芯片為代表,一梯隊(duì),有成熟產(chǎn)品、批量出貨的企業(yè),主要包括寒武紀(jì)、華為海思、百度昆侖芯、燧原科技,這四家有2-3代更多的產(chǎn)品,技術(shù)能力、軟件能力都有一定積累;二梯隊(duì),主要包括以AI芯片起家的壁仞科技、天數(shù)智心、摩爾線程、沐曦等。壁仞科技去年發(fā)布的產(chǎn)品規(guī)格很高,但主要還停留在紙面數(shù)據(jù),實(shí)測數(shù)據(jù)、實(shí)際性能方面業(yè)界和第三方評測機(jī)構(gòu)評價(jià)沒有那么高,軟件層面從使用角度來講也還有很大的成長空間。其他幾家也陸續(xù)有產(chǎn)品推出,但技術(shù)能力還停留在推理層面,不像一梯隊(duì)企業(yè)有更成熟的產(chǎn)品經(jīng)驗(yàn);三梯隊(duì),如海光、景嘉微等。技術(shù)能力還有待市場的認(rèn)可和驗(yàn)證。
從產(chǎn)品來說,目前國內(nèi)已經(jīng)批量生產(chǎn)的產(chǎn)品大多都是A100的上一代,如昆侖芯三代、思遠(yuǎn)590、燧思3.0等,不過,各公司正在研發(fā)更新一代產(chǎn)品,縮小國內(nèi)外差距。向后看,基于國家政策的大力支持,以及自主可控的迫切需求,中國廠商有望迎來更大的國產(chǎn)替代機(jī)遇。而如果國內(nèi)產(chǎn)品能夠替代英偉達(dá)的算力產(chǎn)品,將會(huì)是非常大的機(jī)會(huì)。數(shù)據(jù)中心建設(shè)方面也需要服務(wù)器,會(huì)帶動(dòng)國內(nèi)提供大型服務(wù)器的廠商,比如浪潮信息、中科曙光等,以及光模塊、調(diào)節(jié)芯片和散熱技術(shù),需求都會(huì)受益于大模型浪潮。相信隨著國內(nèi)企業(yè)的持續(xù)投入和創(chuàng)新,以及政府的支持,中國在人工智能領(lǐng)域的發(fā)展勢頭仍然很強(qiáng),有望逐步縮小與國外競爭對手的差距。
AI的一切才剛剛開始,其帶來的潛在生產(chǎn)力提升和勞動(dòng)力供應(yīng)的增加等結(jié)果不可低估。而從當(dāng)下的投資時(shí)點(diǎn)來看,2024年半導(dǎo)體芯片板塊投資或許可以關(guān)注三條主邏輯:一是周期底部,景氣復(fù)蘇;二是人工智能推動(dòng)超級創(chuàng)新周期,AI芯片迎來發(fā)展機(jī)遇;三是國產(chǎn)替代研發(fā)成果正在逐步落地,突破性產(chǎn)品發(fā)布。
