又被科技巨頭又聯(lián)手“圍攻”,風光無限的英偉達既有遠慮也有近憂
看不下去英偉達的壟斷,科技巨頭們聯(lián)合出手了。
據(jù)科技媒體TechCrunch最新消息,英特爾、谷歌、微軟、Meta、AMD、惠普、博通、思科聯(lián)合成立了一個新的行業(yè)組織——UALink促進會(the Ultra Accelerator Link Promoter Group,超級加速器鏈接促進會),該組織正在提議制定一項新的行業(yè)標準,應用于數(shù)據(jù)中心里AI芯片之間的互聯(lián)。
提議標準的第一個版本UALink 1.0將通過單個計算“Pod(艙,服務器中的一個或者多個機架)”連接多達1024個AI芯片(僅限GPU)。據(jù)UALink促進會稱,UALink 1.0基于包括AMD的Infinity Fabric在內(nèi)的“開放標準” ,將允許在連接到的AI芯片的內(nèi)存之間進行直接加載和存儲,與現(xiàn)有互連規(guī)范相比,可以提高速度并降低數(shù)據(jù)傳輸延遲。
同時,該組織表示,將在今年第三季度成立“UALink聯(lián)盟”,以監(jiān)督UALink規(guī)范未來的發(fā)展;UALink 1.0將在同一時間向加入該聯(lián)盟的公司提供,帶寬更高的更新規(guī)范UALink 1.1則將于今年第四季度推出。
聯(lián)合制定AI加速器連接標準,挑戰(zhàn)英偉達
除以上公司外,該組織成員還包括AMD、惠普企業(yè)、博通和思科等,Arm尚未參加。UALink推廣組正在提出一項新的行業(yè)標準,以連接日益增多的服務器中的AI加速器芯片。
“行業(yè)需要一個可以快速推進的開放標準,這種標準允許多家公司為整個生態(tài)系統(tǒng)增加價值,”AMD數(shù)據(jù)中心解決方案總經(jīng)理Forrest Norrod表示?!靶袠I(yè)需要一個允許創(chuàng)新快速進行且不受任何單一公司限制的標準?!?/span>
廣義上講,AI加速器是指GPU及其他定制設計的解決方案,用于加速AI模型的訓練、微調(diào)和運行的芯片。UALink提議的標準版本一,UALink 1.0,將連接多達1024個GPU AI加速器,組成一個計算“集群”(pod),意指服務器中的一個或多個機架。根據(jù)UALink推廣組的說法,基于包括AMD的Infinity Fabric在內(nèi)的“開放標準”,UALink 1.0將允許AI加速器所附帶的內(nèi)存之間的直接加載和存儲,并且與現(xiàn)有互連規(guī)范相比,總體上將提高速度,同時降低數(shù)據(jù)傳輸延遲,。
該組織表示,將在第三季度創(chuàng)建一個名為UALink的聯(lián)盟,以監(jiān)督UALink規(guī)范的發(fā)展。UALink 1.0將在同一時間段內(nèi)向加入聯(lián)盟的公司提供,而帶有更高帶寬的迭代版規(guī)范UALink 1.1,預計將在2024年第四季度推出。Norrod表示,第一批UALink產(chǎn)品將在“未來幾年內(nèi)”推出。
分析認為,由于明顯缺少了當今最大的AI加速器生產(chǎn)商英偉達,該組織的成立就是為了挑戰(zhàn)英偉達在AI領域一家獨大的地位。目前,英偉達AI加速器的市場占有率估計在80%到95%。
目前英偉達對此事未予置評,但很明顯,該公司并不熱衷于支持UALink。分析認為,英偉達已經(jīng)為數(shù)據(jù)中心服務器內(nèi)的GPU鏈接提供了自己的專有互連技術,所以可能不太愿意支持基于競爭對手技術的規(guī)范。
英偉達被全世界眼紅
目前全球的AI芯片巨頭,不管是中國AI芯片巨頭,還是美國AI芯片巨頭,都在圍攻英偉達,想要分一杯羹。
先說美國芯片巨頭,有英特爾、meta、谷歌、AMD等。
谷歌(Google)之前發(fā)布了面向云端AI加速的TPU v5p ,能提供918 teraOPS(每秒可執(zhí)行918萬億次整數(shù)運算)的Int8(執(zhí)行8位整數(shù))性能。
英特爾之前發(fā)布了芯片產(chǎn)品 Gaudi 3 AI 加速卡,據(jù)稱其性能是英偉達H100的1.5倍左右,劍指英偉達。
而meta近日,重磅宣布推出第二代自研AI訓練和推理芯片MTIA v2。稀疏算力達到708TFLOPS,也是劍指H100。
AMD就不用說了,本來就推出了各種AI芯片,是英偉達最強勁的對手之一,可見美國這些AI巨頭們,紛紛下場,搶英偉達的市場和份額。
而在中國,AI芯片巨頭們,也是同樣在替代英偉達,并且中國和美國的情況還不一樣,中國大陸買不到英偉達的高端芯片,像H100、A100、H200等都買不到。
現(xiàn)在能買到的最強的只有H20,它只有A100性能的50%,只有H100性能的20%。
于是像華為的昇騰芯片、海光的DCU等AI芯片,更是紛紛替代英偉達的芯片,特別是華為昇騰910,其性能達到了A100的性能,是H20的2倍。
這些國產(chǎn)AI芯片,同樣受到了國內(nèi)AI廠商的青睞,很多人用這些國產(chǎn)AI芯片來替代英偉達的AI芯片。
不過大家也清楚,替代英偉達的AI芯片容易,但要替代英偉達的CUDA生態(tài)較難,因為目前市面上90% AI應用,AI算法,大多是CUDA下訓練出來的,離開CUDA啥都不是。
那么這又該怎么辦呢?于是intel、谷歌、ARM、高通等,又想了一招,那就是成立了一個UXL聯(lián)盟,劍指英偉達的CUDA,要搞一個統(tǒng)一的、開放的AI生態(tài)。
UXL聯(lián)盟想的非常好,那就是搞一套可以運行在任何GPU芯片上的AI生態(tài),不用GPU芯片的限制,這樣就能打破英偉達的壟斷了,以后只要誰推出了很強的AI芯片,就能不受生態(tài)限制,直接狂飆,受到市場的喜歡。
很明顯,從現(xiàn)在的情況來看,AI芯片市場的競爭在接下來的幾年,會愈演愈烈,參與的廠商也會越來越多,按照機構的預計,到2035年,AI將為全球貢獻近90萬億元的經(jīng)濟價值。
英偉達又要被迫放棄一大市場
據(jù)報道,美國政府日前已放緩向英偉達、AMD、英特爾和Cerebras等4家美國公司向中東出口AI芯片的許可證,并對該地AI發(fā)展進行國家安全檢查,主要原因是擔心相關受限的AI芯片最終流向中國。
報道稱,美國特別關注大量AI芯片銷售的走向,因為阿聯(lián)酋和沙特阿拉伯等國都希望大量進口AI數(shù)據(jù)中心芯片。目前,美國政府官員們正在對該地區(qū)的 AI 開發(fā)進行國家安全評估,但尚不清楚評估需要多長時間,怎樣才算大批量出口也沒有具體定義。
截至發(fā)稿前,上述提及的四家公司均不予置評。
據(jù)悉,英偉達所提出的 AI 加速計算芯片,是當前 AI 大模型和生成式 AI 技術領域的關鍵基礎設施。去年10月,美國商務部將中國、以及中東大部分地區(qū)等納入到芯片出口管制范圍。因此相關美國AI芯片廠商需要獲得美國政府的特別許可,才能出口先進的AI芯片和芯片制造設備給這些國家。
但是,過去幾周,相關許可證申請都被延后或者不給回復。消息人士稱,美國企業(yè)嘗試向阿聯(lián)酋、沙特阿拉伯和卡塔爾客戶銷售產(chǎn)品的公司都受到了影響。而美國目的是增加審查時間,以在海外部署先進芯片出口的全面策略,包括商討誰來管理和保護用于訓練AI模型的設施。
對此消息,美國商務部稱,最優(yōu)先考慮國家安全。對于最先進技術,將徹底調(diào)查先進技術運往世界各地的許可證申請,并致力于與中東乃至各國的伙伴合作,保護技術生態(tài)系統(tǒng)。
值得一提的是,美國商務部出口管理部門負責人 Thea Kendler本月初訪問了阿聯(lián)酋、沙特阿拉伯、卡塔爾和科威特。其中,在阿聯(lián)酋,她表示在半導體出口管制方面的合作取得了關鍵進展。
目前,阿聯(lián)酋和沙特一直在爭奪AI領導地位,以減緩經(jīng)濟過度仰賴石油,兩國都將美國視為重要合作伙伴,因此會滿足美國要求。但是,沙特剛與中國聯(lián)想集團達成協(xié)定,將在沙國首都利雅得建立研發(fā)中心,因此后續(xù)發(fā)展仍有待觀察。
與此同時,微軟也宣布向總部位于阿布扎比的AI公司G42投資15億美元,能否順利獲得出口許可證將是關鍵問題。
