Imagination:數(shù)據(jù)中心跨入“智算”時(shí)代 “軟硬協(xié)同”能否成“芯變”良方?
Imagination人工智能產(chǎn)品營銷高級(jí)總監(jiān)Andrew Grant:“相比從硬件轉(zhuǎn)向軟件,將會(huì)更多地出現(xiàn)從使用GPU這樣更通用的元件轉(zhuǎn)向關(guān)注ASIC。尤其在AI領(lǐng)域,擁有專為與GPU協(xié)同工作及增強(qiáng)GPU批量計(jì)算能力而設(shè)計(jì)的電路,就可以持續(xù)支撐AI任務(wù)中不斷增加的數(shù)據(jù)量和復(fù)雜性。NNA就是這樣一種ASIC,它將持續(xù)開拓?cái)?shù)據(jù)中心的AI和機(jī)器學(xué)習(xí)功能。當(dāng)與GPU的通用計(jì)算協(xié)同實(shí)現(xiàn),并與高效、豐富的數(shù)據(jù)集和算法集成在一起時(shí),跟上AI的發(fā)展步伐將變得更加可控?!?/p>
如今的服務(wù)器芯片市場(chǎng)正積極擁抱“多樣化”。結(jié)合當(dāng)前的市場(chǎng)形勢(shì),這種多樣化不僅限于指令集和IP核,在微架構(gòu)層面上,為解決當(dāng)下實(shí)際應(yīng)用中日益突出的算力不足、功耗過高以及由此衍生的各類成本問題,行業(yè)也迫切需要發(fā)起一場(chǎng)“芯變”。
服務(wù)器芯片市場(chǎng)的“質(zhì)變”
以傳統(tǒng)數(shù)據(jù)中心當(dāng)中采用的GPU為例,Imagination人工智能產(chǎn)品營銷高級(jí)總監(jiān)Andrew Grant認(rèn)為:“對(duì)于從機(jī)器學(xué)習(xí)和AI到云游戲的眾多數(shù)據(jù)中心應(yīng)用而言,使用GPU是因?yàn)槠淇商峁┐笠?guī)模的并行算力。然而,傳統(tǒng)的數(shù)據(jù)中心GPU最大的缺點(diǎn)之一是其產(chǎn)生的熱量和能耗。這將引發(fā)兩方面的問題,首先,它們的供電和冷卻成本會(huì)非常高。其次,也是更重要的,這意味著它們無法在現(xiàn)有的機(jī)架中高密度部署,進(jìn)一步意味著數(shù)據(jù)中心每平方米的單位計(jì)算密度更低?!?/p>
為此,Imagination開發(fā)了非常適合數(shù)據(jù)中心的GPU方案,但這種方法并不是把高耗能的桌面級(jí)GPU組件精簡后直接用于數(shù)據(jù)中心,而是利用了Imagination在嵌入式和汽車領(lǐng)域的長期研究成果來降低能耗。
Andrew Grant指出:“這意味著像IMG B系列GPU這樣的產(chǎn)品可以在非常低的功耗限制和散熱配置下提供令人難以置信的高性能。雖然每個(gè)單獨(dú)的GPU可能不像某些同類產(chǎn)品那么強(qiáng)大,但是我們能夠以無限擴(kuò)展和高密度機(jī)架部署的方式來提高數(shù)據(jù)中心單位面積的計(jì)算密度。對(duì)AI工作負(fù)載而言,IMG Series4 NNA專用集成電路(ASIC)專為多核集群而設(shè)計(jì),是減少數(shù)據(jù)中心面積的理想選擇,并且作為ASIC,它運(yùn)行神經(jīng)網(wǎng)絡(luò)任務(wù)時(shí)的速度比其它組件要快幾個(gè)數(shù)量級(jí)。”
為了進(jìn)一步挖掘芯片微架構(gòu)的潛能,AI高性能計(jì)算市場(chǎng)也逐漸興起一陣“異構(gòu)計(jì)算”的狂潮,Andrew Grant補(bǔ)充到:“我們注意到人們對(duì)異構(gòu)計(jì)算的興趣與日俱增。在異構(gòu)計(jì)算中,特性不同的運(yùn)算單元被組合在一起,用于處理與其各自設(shè)計(jì)相適應(yīng)的任務(wù),例如GPGPU用于浮點(diǎn)運(yùn)算,加速器用于推理等特定的工作負(fù)載?!倍铀倨骺梢允荈PGA、GPU抑或是ASIC,通過多種模塊的互補(bǔ)組合與搭配,從而找到能夠在功耗、算力以及成本等多個(gè)層面上的最優(yōu)解方案。
當(dāng)然,圍繞超高性能嵌入式系統(tǒng)級(jí)芯片(SoC)去設(shè)計(jì)下一代數(shù)據(jù)中心也是一種可行路徑,這些SoC可以使用通用的工具,處理互補(bǔ)的工作負(fù)載,并提供出色的性能、功耗和面積(PPA)。因此,對(duì)數(shù)據(jù)中心而言,它可以降低功耗和熱量,同時(shí)提高面積效率并最小化硅成本——從而使超大規(guī)模數(shù)據(jù)中心能夠提供更具競(jìng)爭力的解決方案。
硬件Or軟件:“智算”時(shí)代究竟誰更重要?
即便是“智算”時(shí)代,軟件的壁壘比硬件要更高,可這二者之間仍然是齊頭并進(jìn)、相互依存、共謀發(fā)展的關(guān)系。畢竟,AI芯片成功的關(guān)鍵在于硬件/軟件的協(xié)同設(shè)計(jì),AI芯片本身只起到加速的作用, 除了少量定制化AI芯片具備一定功能外,大多數(shù)AI芯片本身并不具備功能,它們的功能必須結(jié)合相關(guān)軟件來實(shí)現(xiàn),這里的軟件包含芯片底層的驅(qū)動(dòng)、開發(fā)工具鏈、各類計(jì)算庫、IR中間件、深度學(xué)習(xí)框架以及人機(jī)交互的界面等等。
Imagination也認(rèn)為硬件和軟件應(yīng)該是高度相互依賴的,沒有正確的硬件,世界上最好的軟件也是無用的,反之亦然,Andrew Grant指出:“相比從硬件轉(zhuǎn)向軟件,將會(huì)更多地出現(xiàn)從使用GPU這樣更通用的元件轉(zhuǎn)向關(guān)注ASIC。尤其在AI領(lǐng)域,擁有專為與GPU協(xié)同工作及增強(qiáng)GPU批量計(jì)算能力而設(shè)計(jì)的電路,就可以持續(xù)支撐AI任務(wù)中不斷增加的數(shù)據(jù)量和復(fù)雜性。NNA就是這樣一種ASIC,它將持續(xù)開拓?cái)?shù)據(jù)中心的AI和機(jī)器學(xué)習(xí)功能。當(dāng)與GPU的通用計(jì)算協(xié)同實(shí)現(xiàn),并與高效、豐富的數(shù)據(jù)集和算法集成在一起時(shí),跟上AI的發(fā)展步伐將變得更加可控。AI是一個(gè)令人興奮的領(lǐng)域,AI框架的開發(fā)在不斷演進(jìn)。我們?cè)谧约旱能浖ぞ咧幸呀?jīng)考慮了這一點(diǎn),從而可以支持客戶在現(xiàn)有設(shè)計(jì)上運(yùn)行最新的網(wǎng)絡(luò),延長了我們?cè)O(shè)計(jì)的使用壽命和實(shí)用性,同時(shí)有助于向客戶確保我們?cè)谠O(shè)計(jì)產(chǎn)品時(shí)有效地考慮了未來發(fā)展?!?/p>
但這并不能改變軟件構(gòu)成芯片企業(yè)核心競(jìng)爭力的事實(shí),鄒挺告訴記者:“生態(tài)和開源軟件是Arm長久以來努力工作的方向。一直以來,Arm都在跟生態(tài)中的主要公司保持密切合作,包括軟件生態(tài)中的各個(gè)環(huán)節(jié),從固件、操作系統(tǒng)、虛擬化軟件,到編程語言,到應(yīng)用程序。近年來Arm軟件生態(tài)有了長足的進(jìn)步,各種主流開源軟件都能直接運(yùn)行于Arm的硬件,基于Arm的軟件開發(fā)越來越容易。比競(jìng)爭壁壘更重要的是可重用性、標(biāo)準(zhǔn)化和合作。Arm去年發(fā)布了Cassini項(xiàng)目,它的目標(biāo)是讓硬件廠商、開發(fā)者、和最終用戶有了一套共同的操作框架,遵循這個(gè)框架會(huì)容易地開發(fā)和部署應(yīng)用程序。這些標(biāo)準(zhǔn)化工作避免了分歧,使能了創(chuàng)新和合作?!倍@,也將成為Arm公司接下來持續(xù)引領(lǐng)全球芯片IP市場(chǎng)的關(guān)鍵。
總之,歷經(jīng)充實(shí)“量變”之后的服務(wù)器芯片市場(chǎng),已經(jīng)開始從多個(gè)角度醞釀著“質(zhì)變”。而對(duì)于各路沉浮這一領(lǐng)域多年的“老江湖”們來說,這既是一個(gè)拼“家底兒”的時(shí)刻,又是“更上一層樓”的契機(jī)。顯然,在這條競(jìng)爭已經(jīng)白熱化的賽道上,從硬件的角度能夠挖掘的“差異化”價(jià)值會(huì)越來越少,更多的發(fā)力軟件生態(tài)或許會(huì)是各路玩家構(gòu)建核心競(jìng)爭力之路上比較明朗且真正能夠有回報(bào)的路徑。
