WAIC上的燧原:正從萬卡,走向十萬卡集群
關(guān)鍵詞: 燧原S60 L600 AI應(yīng)用 智算中心 集群建設(shè)
今年WAIC(世界人工智能大會)燧原科技展位相比往年——在產(chǎn)品展示上簡單了不少,主打的就是燧原推理卡S60及其應(yīng)用;剛剛發(fā)布的L600訓(xùn)推一體卡也有展示,可惜是以邀請的方式、不向大眾開放——所以我們沒能拍到L600真容。
不過今年燧原科技參與WAIC給我們的感覺是:AI技術(shù)更務(wù)實、更落地了,展臺工作人員向我們介紹的主要都是燧原芯片和加速卡的各類應(yīng)用,以及智算中心的建設(shè)情況。WAIC期間的“芯節(jié)點·新突破——協(xié)同創(chuàng)新聚力 加速智算破局”論壇上,燧原科技創(chuàng)始人、董事長、CEO趙立東也談到,AI芯片企業(yè)要想長期可持續(xù)發(fā)展,需要實現(xiàn)從技術(shù)產(chǎn)品閉環(huán)到商業(yè)化閉環(huán)的跨越。
這次我們就通過燧原展位的簡單參觀,看看更務(wù)實和落地的燧原AI產(chǎn)品商業(yè)化進度。
▲ 就我們現(xiàn)場看到的,燧原本次展示主要就圍繞著燧原S60展開——這是一款去年就已經(jīng)量產(chǎn)的人工智能訓(xùn)推一體加速卡,基于GCU320。上圖中的這款是PCIe 5.0、全高全長雙寬規(guī)格,TBP約在300W左右。從官網(wǎng)和工作人員的介紹來看,其主力應(yīng)用場景應(yīng)當就是AI推理。
燧原科技創(chuàng)始人兼COO張亞林在論壇上回顧說燧原此前“經(jīng)歷了三代四顆芯片的‘芯’路歷程:2020年發(fā)布第一代產(chǎn)品,完成了千卡集群;2022年發(fā)布第二代的訓(xùn)練產(chǎn)品和推理產(chǎn)品;2024年發(fā)布第三代產(chǎn)品——燧原S60”。
據(jù)說,目前僅燧原S60這一款產(chǎn)品,過去一年就已經(jīng)實現(xiàn)了“7萬卡的落地規(guī)模”,“在國內(nèi)是第一梯隊”;“支持超過300個應(yīng)用場景,包括大語言模型、多模態(tài)大模型、搜索廣告推薦、傳統(tǒng)AI模型等”;“參與建設(shè)五大智算集群,支持頂流應(yīng)用,服務(wù)10億以上規(guī)模終端用戶”。
展位工作人員特別介紹說,S60對于傳統(tǒng)模型和生成式AI大模型的支持都相當好,無論是“對象或圖片分類、自然語義理解,還是文本、圖片和視頻生成”,“應(yīng)用面很廣泛”。他特別強調(diào)了大模型推理應(yīng)用,“比如代碼生成——國內(nèi)很多軟件公司的研發(fā)工程師就開始用AI來輔助代碼生成了”;
“還有AI搜索能替代傳統(tǒng)搜索,大模型結(jié)合RAG把搜索結(jié)果鏈接中的內(nèi)容提煉出來,并根據(jù)用戶提問,生成一些更明確的信息,大幅提升了用戶的搜索滿意度?!薄皬恼w上來看,互聯(lián)網(wǎng)企業(yè)都開始用大模型去替代傳統(tǒng)業(yè)務(wù)應(yīng)用了?!?/p>
“燧原S60對主流大模型的支持都很出色?!?nbsp;“像是我們對Stable Diffusion的優(yōu)化,對更多DiT結(jié)構(gòu)模型的支持;還有基于客戶需求去做定制優(yōu)化。”
▲ 基于燧原S60的一體機也在展會現(xiàn)場做了展示。張亞林在演講中提到燧原推出了基于S60的DeepSeek一體機系統(tǒng)方案矩陣,覆蓋滿血版、蒸餾版不同尺寸大模型。
從宣傳介紹來看,燧原S60的一體機產(chǎn)品涵蓋4卡、8卡、16卡、32卡等不同擴展版本,上圖展示的主要是8卡方案(一體機標準版),用于支持中小企業(yè)的各類AI應(yīng)用。上到16卡時,就能支持滿血版DeepSeek 671b了;32卡的一體機POD版可用于規(guī)?;瘧?yīng)用。
順帶一提未在展位現(xiàn)場露真容的L600——燧原在介紹中提到,作為第四代訓(xùn)推一體產(chǎn)品,“歷經(jīng)兩年半時間研發(fā),面向訓(xùn)練及推理場景,國內(nèi)首創(chuàng)原生FP8低精度算力,擁有144GB存儲容量、3.6TB/s存儲帶寬、800GB/s互聯(lián)帶寬”。
基于L600的云燧OGX系列多卡方案,如OGX400實現(xiàn)了單機八卡OAM全互聯(lián),1152GB單機存儲容量、28.8TB/s單機存儲帶寬、2.8TB/s單機聚合帶寬,單機支持DeepSeek滿血版。還有云燧ESL超節(jié)點系統(tǒng)單節(jié)點最高64卡全帶寬互聯(lián),采用液冷方案,可實現(xiàn)9216GB單節(jié)點存儲容量、230TB/s單節(jié)點存儲帶寬、51.2TB/s單節(jié)點聚合帶寬、單節(jié)點可支持PD分離優(yōu)化。
▲ AI基礎(chǔ)設(shè)施走向集群化、系統(tǒng)化也是今年國產(chǎn)AI芯片廠商普遍在談的話題。在超節(jié)點打造和集群建設(shè)方面,張亞林說:“燧原和頭部互聯(lián)網(wǎng)企業(yè)聯(lián)合定制開發(fā)超節(jié)點,聯(lián)合定制打造萬卡訓(xùn)練集群;與中國移動聯(lián)合開發(fā)高密度節(jié)點,參與運營商集群建設(shè);與‘東數(shù)西算’節(jié)點甘肅慶陽聯(lián)合推進萬卡集群項目,提供高效能國產(chǎn)化算力?!?/p>
據(jù)說基于剛剛發(fā)布的第四代產(chǎn)品,燧原正在推進十萬卡集群建設(shè)。
展位現(xiàn)場工作人員向我們介紹了位于宜昌的智算中心和慶陽的萬卡推理集群?!拔鞑侩妰r和各方面的建設(shè)、運維成本相對更低,對智算中心而言更具性價比。我們希望能做到‘算盡其用’,讓各行各業(yè)都能把算力用起來?!?/p>
“湖北宜昌的智算中心是我們2023年建的?!逼渲兄饕€是基于燧原的第二代產(chǎn)品與解決方案?!艾F(xiàn)在也跟下游的很多企業(yè),比如無問芯穹、智譜合作?;谠谱赓U這種比較成熟的商業(yè)模式,能夠給客戶提供具備彈性的算力解決方案?!?/p>
“慶陽的萬卡推理集群已經(jīng)在用S60推理卡?!薄白鳛槲鞑课宕笏懔屑~之一,在慶陽建起萬卡集群,就能更好地讓S60服務(wù)于美圖這樣的行業(yè)客戶?!?/p>
▲ 與美圖的合作,在燧原展位上是作為關(guān)鍵應(yīng)用案例之一來展示的?!懊缊D現(xiàn)在已經(jīng)在基于燧原S60做生圖、生視頻的應(yīng)用和服務(wù)了,累計使用燧原近萬卡的算力規(guī)模?!薄氨热缦馎I換裝功能,背后就有我們的算力支持?!?/p>
“燧原通過對PyTorch原生推理的支持和優(yōu)化,和美圖的技術(shù)團隊做了深度耦合?!惫ぷ魅藛T在介紹與美圖的合作時提到,“去滿足美圖自研模型、軟件優(yōu)化的需求?!薄按汗?jié)期間,美圖的用戶量短時間內(nèi)發(fā)生暴增——我們就能做到萬卡的彈性動態(tài)調(diào)度,保證美圖用戶有好的使用體驗?!?/p>
“我們慶陽的推理集群就能夠給到很好的支持——結(jié)合東數(shù)西算帶來的性價比優(yōu)勢,這對我們的合作來說,達成了雙贏?!?/p>
▲ 燧原產(chǎn)品的更多大模型應(yīng)用落地,還囊括了與互聯(lián)網(wǎng)頭部企業(yè)之間的合作。比如論壇活動上就出現(xiàn)了騰訊的身影。騰訊云副總裁許華彬說,騰訊擁有600多個業(yè)務(wù)場景,如社交內(nèi)容、游戲、辦公等領(lǐng)域,均用AI大模型進行了創(chuàng)新實踐,也得到了燧原算力的支持。
“基于燧原的算力,跟騰訊這樣的頭部客戶去實現(xiàn)應(yīng)用落地?!闭刮还ぷ魅藛T在談互聯(lián)網(wǎng)應(yīng)用案例時說,“比如微信語音和文字的互轉(zhuǎn),還有像是公眾號文章的語音朗讀——這類基于傳統(tǒng)模型的特性,可以基于AI去實現(xiàn);在大模型方面,很多互聯(lián)網(wǎng)公司會用Transformer大模型去提升搜索體驗,包括充分利用大模型的多模態(tài)理解能力?!薄氨热鐖D片+文字+視頻的互動,再去生成內(nèi)容?!?/p>
當然燧原AI產(chǎn)品的合作與落地遠不止這些,但我們能夠從中窺見生成式AI應(yīng)用的潛在市場仍然是巨大的。趙立東在主題論壇活動上談到“對未來人工智能產(chǎn)業(yè)發(fā)展趨勢”的“幾點觀察”。包括“第一,當前訓(xùn)練規(guī)模越來越大,但玩家越來越少”——這在我們看來,表明的正是AI市場逐步走向成熟;
“第二,算力基礎(chǔ)設(shè)施正在走向集群化、系統(tǒng)化?!比缜八?,這不僅體現(xiàn)市場對AI算力的渴求,也是AI技術(shù)落地的表現(xiàn)之一。如趙立東所說集群“相關(guān)軟硬件技術(shù),包括超節(jié)點、網(wǎng)絡(luò)技術(shù)、全光互聯(lián)、低精度、分布式并行計算、虛擬化等,已不再是一家公司可以單獨完成,而是需要跨行業(yè)協(xié)作,多方聚力,構(gòu)建系統(tǒng)化的解決方案”。
“第三,開源開放是必經(jīng)之路?!边@一點更多表現(xiàn)的,應(yīng)該是打破做自有封閉生態(tài)的國際巨頭的壟斷,通過合作共建開放生態(tài),一起實現(xiàn)AI應(yīng)用普及和大眾化,也是行業(yè)大部分參與者的共識。展望未來,隨著包括最新發(fā)布的L600在內(nèi)的第四代產(chǎn)品的推出,燧原正在推進從萬卡到十萬卡的集群建設(shè)——AI創(chuàng)新應(yīng)用大概還會更大程度地突破現(xiàn)有市場的想象。
