Cerebras 推出“巨芯”二代:采用臺積電 7nm 制程,和餐盤差不多大
美國硅谷創(chuàng)企 Cerebras Systems 推出了其新的 Wafer Scale Engine 2(WSE-2)處理器,該處理器為超級計算任務(wù)而構(gòu)建,具有破紀(jì)錄的 2.6 萬億個晶體管(市場上最大的 GPU 只有 540 億個晶體管)和 85 萬顆 AI 優(yōu)化內(nèi)核,大小類似餐盤,采用臺積電的 7nm 工藝。
這是 Cerebras 第二次使用整個 300mm 晶圓制造單顆芯片。這么大的晶圓一般會被切割成數(shù)百個獨立芯片,Cerebras 卻將其制成一個芯片。在龐大的體積之下,這種芯片相比同等算力的 GPU 集群,功耗和所占空間更小。
▲WSE-2 與最大的 GPU 尺寸對比
一、Cerebras 估值約 24 億美元,創(chuàng)始人斯坦福出身
Cerebras Systems 位于美國加利福尼亞州,創(chuàng)建于 2016 年。該公司專注于深度學(xué)習(xí)的計算機系統(tǒng)。目前該公司在硅谷、多倫多和東京都有辦事處,2019 年 11 月獲得了 4.75 億美元的 E 輪融。融資后,Cerebras Systems 估值約為 24 億美元。
安德魯?費爾德曼(Andrew Feldman)是 Cerebras 的聯(lián)合創(chuàng)始人兼首席執(zhí)行官,他具有斯坦福大學(xué)學(xué)士學(xué)位和工商管理碩士學(xué)位,曾經(jīng)創(chuàng)辦了專注于超高密度計算機服務(wù)器業(yè)務(wù)的 Seammicro 公司。Seammicro 在 2012 年被 AMD 以 3.57 億美元價格收購。
▲Cerebras 聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Andrew Feldman
2019 年,Cerebras 曾發(fā)布第一代 WSE 芯片,這款芯片具有 40 萬個內(nèi)核和 1.2 萬億個晶體管,使用臺積電 16nm 工藝制程。
二、WSE-2 性能參數(shù)超競品幾個數(shù)量級,良率更高
WSE-2 仍由臺積電代工,但采用更加先進的 7nm 工藝。與第一代芯片相比,WSE-2 的晶體管數(shù)、內(nèi)核數(shù)、內(nèi)存、內(nèi)存帶寬和結(jié)構(gòu)帶寬等性能特征增加了一倍以上。由于 WSE-2 采用了 7nm 工藝制程,電路之間的寬度僅有七十億分之一米。
如此龐大的芯片尺寸帶來了 WSE-2 的大幅性能提升,該芯片的各類性能參數(shù)超出競品幾個數(shù)量級,能夠極大地縮減 AI 訓(xùn)練時間。
相比競品 GPU,WSE-2 芯片的內(nèi)核數(shù)量是其 123 倍,芯片內(nèi)存是競品的 1000 倍以上,內(nèi)存帶寬是 12000 倍,結(jié)構(gòu)帶寬也增加了 45000 倍。
▲WSE、WSE-2 和英偉達 A100GPU 性能參數(shù)對比
Feldman 指出,通過將芯片放大互連,就可以在芯片上保留大量數(shù)據(jù)。WSE-2 相對普通 GPU 集群,延遲和能耗都會比較低。普通 GPU 集群在提供相同的算力時,將會需要數(shù)十個機架,花費數(shù)個月進行配置和編程,功率將高達數(shù)百瓦。
WSE-2 相對 GPU 還有很多核心冗余,如果有內(nèi)核發(fā)生故障,單獨的故障內(nèi)核并不影響芯片使用。而在臺積電這樣的晶圓代工廠中,很少出現(xiàn)連續(xù)的內(nèi)核缺陷,因此 WSE-2 的良率較高。
三、Cerebras 擁有多位重量級客戶
國際調(diào)研機構(gòu) Moor Insights&Strategy 的分析師 Patrick Moorhead 認為,WSE-2 內(nèi)核數(shù)量帶來的性能確實對英偉達的 GPU 產(chǎn)生了一定挑戰(zhàn)。但是英偉達的解決方案更加靈活,幾乎可以安裝在任何服務(wù)器機箱中。
Tirias Research 首席分析師 Jim McGregor 在一封電子郵件中寫道,雖然對于數(shù)以百萬的 AI 算法來說,Cerebras 不像英偉達一樣全面,但是 Cerebras 的解決方案顯然已經(jīng)吸引到了許多客戶。
從 2019 年交付 WSE 芯片起,在過去的一年里,已經(jīng)有很多重量級用戶使用了 Cerebras 的產(chǎn)品。
比如美國阿貢國家實驗室、勞倫斯利弗莫爾國家實驗室、匹茲堡超級計算中心、愛丁堡大學(xué)的超級計算中心、葛蘭素史克、東京電子器件等。
全球制藥巨頭葛蘭素史克的高級副總裁 Kim Branson 稱贊到,Cerebras 增加了編碼器模型的復(fù)雜性,將訓(xùn)練時間減少到之前的 1/80。
在美國最大的科學(xué)與工程研究室阿貢國家實驗室,CS-1 芯片被用于癌癥研究,將癌癥模型的實驗周轉(zhuǎn)時間減少到 1/300 還少。
Feldman 說,Cerebras 將在明年公布產(chǎn)品在重型制造、制藥、生物技術(shù)和軍事等領(lǐng)域取得的成就。WSE-2 將被集成到 CS-2 超算系統(tǒng)中,在今年第三季度上市。
結(jié)語:Cerebras 另辟蹊徑展現(xiàn)巨型芯片前景
雖然相比英偉達,Cerebras 沒有那么全面,但是 WSE 系列芯片并非單純的放大。在芯片尺寸如此巨大后,互連技術(shù)、芯片封裝、散熱等問題都會發(fā)生很大變化。
Cerebras 解決了這些問題,用 WSE-2 的優(yōu)點向我們展示了芯片尺寸并非只能越做越小,巨型芯片也存在廣泛的應(yīng)用前景。
