日日躁夜夜躁狠狠躁超碰97,无码国内精品久久综合88 ,热re99久久精品国99热,国产萌白酱喷水视频在线播放

歡迎訪(fǎng)問(wèn)深圳市中小企業(yè)公共服務(wù)平臺(tái)電子信息窗口

算力的基礎(chǔ)是AI芯片不假,但服務(wù)器才是發(fā)揮效用的趁手工具

2024-06-17 來(lái)源:賢集網(wǎng)
1505

關(guān)鍵詞: 人工智能 GPU 芯片

對(duì)于大規(guī)模模型訓(xùn)練而言,算力硬件無(wú)疑是支撐其發(fā)展的核心基石之一。隨著全球算力需求逐漸轉(zhuǎn)向人工智能領(lǐng)域,搭載GPU的AI服務(wù)器應(yīng)運(yùn)而生,成為滿(mǎn)足這一需求的關(guān)鍵力量。

據(jù)TrendForce預(yù)測(cè),2023年AI服務(wù)器(包括搭載GPU、FPGA、ASIC等各類(lèi)加速器)的出貨量將達(dá)到約118萬(wàn)臺(tái),同比增長(zhǎng)率高達(dá)38.4%。這一增長(zhǎng)速度遠(yuǎn)超整體服務(wù)器市場(chǎng),預(yù)計(jì)AI服務(wù)器在整體服務(wù)器出貨量中的占比將接近9%,預(yù)計(jì)到2026年,AI服務(wù)器的占比將提升至15%,出貨量有望達(dá)到236萬(wàn)臺(tái)。



AI服務(wù)器成長(zhǎng)力道強(qiáng)勁

服務(wù)器作為一種高性能計(jì)算機(jī),通常用于處理網(wǎng)絡(luò)上的數(shù)據(jù)、存儲(chǔ)和傳輸數(shù)據(jù),并提供各種網(wǎng)絡(luò)服務(wù),以滿(mǎn)足客戶(hù)端請(qǐng)求與需要,在網(wǎng)絡(luò)環(huán)境中扮演十分重要的角色。

AI服務(wù)器即專(zhuān)門(mén)為人工智能應(yīng)用設(shè)計(jì)的高性能計(jì)算平臺(tái),與傳統(tǒng)服務(wù)器相比,在用途上AI服務(wù)器專(zhuān)門(mén)設(shè)計(jì)用于處理大規(guī)模數(shù)據(jù)和提供高效計(jì)算能力以支持人工智能應(yīng)用;在硬件配置上,二者皆采用高速網(wǎng)絡(luò)技術(shù)與硬件加速技術(shù),與傳統(tǒng)服務(wù)器以CPU為主要算力的形式不同,AI服務(wù)器需要滿(mǎn)足AI算法下高性能計(jì)算、高存儲(chǔ)需求,因而配置更加復(fù)雜,除了CPU之外,通常還需配備GPU、FPGA、ASIC等加速芯片,以滿(mǎn)足AI算法訓(xùn)練和推理過(guò)程中對(duì)高吞吐量計(jì)算的需求,此外也需要配備大內(nèi)存、高速SSD等存儲(chǔ)產(chǎn)品。

當(dāng)前AI服務(wù)器多屬于“機(jī)架服務(wù)器”,一個(gè)機(jī)柜放多個(gè)服務(wù)器機(jī)箱,規(guī)格以U為代稱(chēng),比如1U、2U、4U、7U等,AI需求越高,數(shù)字則越大。

AI大模型有訓(xùn)練(Training)、推理(Inference)兩大應(yīng)用場(chǎng)景需求,以此劃分,AI服務(wù)器主要有訓(xùn)練型與推理型兩類(lèi),其中訓(xùn)練型AI服務(wù)器算力要求極高,多數(shù)部署于云端,推理型AI服務(wù)器則對(duì)算力無(wú)太高需求,主要部署于云端與邊緣側(cè)。

在AI需求推動(dòng)下,AI服務(wù)器成長(zhǎng)力道強(qiáng)勁。全球市場(chǎng)研究機(jī)構(gòu)TrendForce集邦咨詢(xún)預(yù)估,2024年全球AI服務(wù)器(包含AI Training及AI Inference)將超過(guò)160萬(wàn)臺(tái),年成長(zhǎng)率達(dá)40%。

此外今年3月,科技大廠(chǎng)戴爾大幅上調(diào)了AI服務(wù)器全球TAM(潛在市場(chǎng)規(guī)模),該公司預(yù)計(jì)2025年與2027年全球AI服務(wù)器TAM分別達(dá)到1050億美元與1520億美元,高于此前預(yù)期的910億美元與1240億美元。


服務(wù)器革命:從幕后到臺(tái)前的算力基石

AI服務(wù)器對(duì)算力行業(yè)的重塑,是一次可以類(lèi)比電車(chē)對(duì)燃油車(chē)的革命。

當(dāng)年不少人認(rèn)為汽車(chē)技術(shù)已經(jīng)相當(dāng)固定了的時(shí)候,新能源車(chē)成了產(chǎn)業(yè)鏈徹頭徹尾的顛覆者,這一影響一直延續(xù)至今還在持續(xù)發(fā)酵。

無(wú)可爭(zhēng)辯的是,下一個(gè)時(shí)代是數(shù)字經(jīng)濟(jì)時(shí)代,所以這輪的服務(wù)器革命乘數(shù)效應(yīng)注定將更為宏大,整個(gè)人類(lèi)社會(huì)和經(jīng)濟(jì)構(gòu)成模式都將被撬動(dòng)。服務(wù)器這個(gè)典型to B的產(chǎn)品,成為了每一個(gè)個(gè)體不得不去關(guān)心的工業(yè)品,這也解釋了文章開(kāi)頭提到的名場(chǎng)面。

電車(chē)顛覆的是出行鏈,往最大了說(shuō)也就是能源革命;而服務(wù)器的變化,重塑的是信息時(shí)代的數(shù)字基座,是將人類(lèi)從機(jī)械、電力、信息時(shí)代推向數(shù)字時(shí)代的“行星發(fā)動(dòng)機(jī)”。



可以得到佐證的是,在英偉達(dá)披露的數(shù)據(jù)中心資本開(kāi)支構(gòu)成中,服務(wù)器單一占比高達(dá)70%,是最大的成本項(xiàng)。數(shù)字經(jīng)濟(jì),用硬件的黑話(huà)來(lái)說(shuō),是一堆服務(wù)器的搭積木游戲。


服務(wù)器從來(lái)都在技術(shù)的前沿

有人認(rèn)為,服務(wù)器無(wú)非就是由主板、內(nèi)存、CPU、磁盤(pán)、網(wǎng)卡、GPU顯卡、電源、主機(jī)箱等硬件設(shè)備組成的一臺(tái)大電腦,早在1945年馮諾依曼就給這個(gè)技術(shù)定了性,毫無(wú)新意可言。再加上服務(wù)器公司由于盈利能力弱,一直都是邊緣板塊。

但從工程創(chuàng)新上,信息時(shí)代開(kāi)始至今的60年間,服務(wù)器其實(shí)從未停止迭代的腳步,經(jīng)歷了從大型機(jī)/小型機(jī)、到PC、到云計(jì)算用服務(wù)器的至少3代升級(jí)。只不過(guò)吃虧于to B的屬性,沒(méi)有幾個(gè)人會(huì)對(duì)機(jī)房里傻大黑粗的服務(wù)器有什么興趣。

復(fù)盤(pán)歷史上服務(wù)器的變革,對(duì)產(chǎn)業(yè)鏈和商業(yè)模式也都有舉足輕重的影響。上一輪帶來(lái)產(chǎn)生顛覆性結(jié)果的是Wintel聯(lián)盟,帶領(lǐng)X86一桶天下,服務(wù)器CPU壟斷者英特爾在歷史上長(zhǎng)期都是芯片的絕對(duì)王者。其次是,云計(jì)算時(shí)代白牌服務(wù)OEM廠(chǎng)商的崛起,臺(tái)系廠(chǎng)商默默占據(jù)了關(guān)鍵位置,并為當(dāng)今的AI服務(wù)器格局早早埋下了伏筆。


AI的算力黑洞,唯有升級(jí)服務(wù)器可對(duì)抗

在算力即國(guó)力的時(shí)代背景下,大規(guī)模并行計(jì)算成為數(shù)字時(shí)代的剛需,背后遵循著大力出奇跡的樸素道理。AI帶來(lái)的算力需求近乎無(wú)上限,而服務(wù)器中的CPU,已經(jīng)成為新大陸下的舊地圖。

在云計(jì)算時(shí)代,大家更多做的是閑置算力的優(yōu)化,是中間層和軟件層的革新,本質(zhì)是一種共享經(jīng)濟(jì)而非技術(shù)革命。而面對(duì)新時(shí)代的需求,提升服務(wù)器及其集群算力成為木桶的最短板,我們?cè)僖怖@不開(kāi)對(duì)硬科技的技術(shù)升級(jí)。

AI 服務(wù)器相較于傳統(tǒng)服務(wù)器最大的差異在于,靠堆料高性能GPU和HBM,最終呈現(xiàn)了突出的異構(gòu)計(jì)算能力,成為填補(bǔ)算力黑洞唯一可行的硬件解法。比如在訓(xùn)練AI服務(wù)器中,GPU的成本占比超過(guò)70%,而在基礎(chǔ)型服務(wù)器中,這一占比僅僅不到20%。

服務(wù)器平臺(tái)的升級(jí),也從跟隨英特爾CPU的代際變化,變成了英偉達(dá)GPU的代際變化。服務(wù)器單機(jī)價(jià)值量也從1萬(wàn)美元左右,飆升到20萬(wàn)美元左右。

英偉達(dá),無(wú)疑成為AI服務(wù)器革新中最大的贏家,市值也一路從3000億美元攀升至3萬(wàn)億美元。顯然,萬(wàn)億美元從來(lái)不是芯片公司的對(duì)價(jià),而是對(duì)服務(wù)器或者說(shuō)數(shù)字經(jīng)濟(jì)這個(gè)大賽道的暢想。


做好生態(tài)建設(shè)

AI大模型時(shí)代,進(jìn)口品牌GPU等高端芯片供應(yīng)面臨周期波動(dòng)挑戰(zhàn),為國(guó)產(chǎn)AI芯片加速推向市場(chǎng)打開(kāi)關(guān)鍵窗口。不過(guò),AI大模型的訓(xùn)練、推理和海量數(shù)據(jù)存儲(chǔ)無(wú)一不需要高性能算力支撐,也對(duì)國(guó)產(chǎn)算力底層基礎(chǔ)設(shè)施能力和生態(tài)建設(shè)提出考驗(yàn)。



艾瑞咨詢(xún)產(chǎn)業(yè)數(shù)字化研究院負(fù)責(zé)人徐樊磊表示,在AI大模型爆發(fā)之前,國(guó)內(nèi)的智能算力資源主要用于推理端。AI大模型趨勢(shì)到來(lái),使國(guó)內(nèi)廠(chǎng)商開(kāi)始推出訓(xùn)練端的算力硬件產(chǎn)品和服務(wù),但目前相關(guān)產(chǎn)品能力比起全球領(lǐng)先算力能力仍有較大差距。

業(yè)內(nèi)人士表示,在計(jì)算層面,由于芯片廠(chǎng)商在開(kāi)發(fā)過(guò)程中使用的技術(shù)路線(xiàn)不同,導(dǎo)致芯片適配服務(wù)器等設(shè)備的開(kāi)發(fā)周期普遍很長(zhǎng)。在訓(xùn)練層面,單芯片算力有限,而大模型訓(xùn)練需要大規(guī)模的算力集群,需要算力系統(tǒng)具有靈活的算力擴(kuò)展能力。在存儲(chǔ)層面,多模態(tài)大模型的訓(xùn)練和推理對(duì)存儲(chǔ)提出了更高要求。

近年來(lái),我國(guó)AI算力市場(chǎng)高度依賴(lài)英偉達(dá)GPU硬件和相應(yīng)的軟件生態(tài)。周韡韡坦言,全球90%的AI工程師都在使用英偉達(dá)GPU配套的CUDA軟件生態(tài),這和英偉達(dá)GPU在全球的壟斷地位完全匹配?!耙恍﹪?guó)產(chǎn)GPU計(jì)算性能并非絕對(duì)不夠,而是若要把國(guó)產(chǎn)GPU和基于CUDA架構(gòu)開(kāi)發(fā)的設(shè)備進(jìn)行適配,需要在調(diào)試和優(yōu)化上花費(fèi)大量精力,導(dǎo)致用戶(hù)使用算力的效率下降?!?/span>

然而,隨著英偉達(dá)芯片進(jìn)口難度不斷提升,國(guó)產(chǎn)AI芯片自主創(chuàng)新任重道遠(yuǎn)。

記者梳理發(fā)現(xiàn),浪潮信息、海光信息、希姆計(jì)算、中科通量、瀚博半導(dǎo)體、墨芯人工智能、摩爾線(xiàn)程、天數(shù)智芯、寒武紀(jì)、燧原科技等芯片公司推出了應(yīng)用于不同場(chǎng)景的AI推理和訓(xùn)練任務(wù)的芯片加速卡,涉及CPU、GPU、RISC-V等不同設(shè)計(jì)架構(gòu)。

海光信息表示,海光DCU兼容CUDA生態(tài),對(duì)文心一言等大多數(shù)國(guó)內(nèi)外主流大模型適配良好。依托DCU可以實(shí)現(xiàn)LLaMa、GPT、Bloom、ChatGLM、悟道、紫東太初等為代表的大模型全面應(yīng)用。

如何進(jìn)一步提升國(guó)產(chǎn)AI芯片競(jìng)爭(zhēng)力?中國(guó)工程院院士、清華大學(xué)教授鄭緯民認(rèn)為,要開(kāi)發(fā)基于國(guó)產(chǎn)AI芯片的系統(tǒng),這一過(guò)程中最重要的是做好生態(tài)建設(shè)?!皣?guó)產(chǎn)AI芯片只要達(dá)到國(guó)外芯片60%的性能,如果生態(tài)做好了,客戶(hù)也會(huì)滿(mǎn)意?!编嵕暶穹Q(chēng)。

徐樊磊建議,做好自主創(chuàng)新要從人才、設(shè)施、科研和生態(tài)領(lǐng)域四方面突破,逐步提升智能算力設(shè)備軟硬件功能。在硬件方面,提高國(guó)產(chǎn)AI芯片的穩(wěn)定性和兼容性,特別是提升芯片之間、服務(wù)器集群之間的數(shù)據(jù)傳輸效果。在軟件生態(tài)方面,降低適配門(mén)檻,讓開(kāi)發(fā)者逐漸使用國(guó)產(chǎn)芯片生態(tài)。