龍芯3D5000研發(fā)成功,能和AMD扳手腕嗎?
事實上,這個也在大家的意料之中,因為自2020年9月15日后,華為麒麟芯片就成為了絕唱,沒有代工廠了,只能靠庫存撐著,自然有用光的一天。
有人表示,華為苦等兩年,沒有等來解封,也沒有等來突破封鎖的“奇跡”,真是可惜。
確實從現(xiàn)在的情況來看,雖然“奇跡”沒有等來,等眾多企業(yè)的努力,還是沒有白費,這些企業(yè)的努力,或深遠(yuǎn)的影響著未來全球芯片的格局。
華為海思提出的芯片堆疊技術(shù),現(xiàn)在來看,暫時沒有成為華為突破芯片封鎖的技術(shù),但通過一些企業(yè)的驗證,未來還是有希望的。
比如龍芯,近日就給華為打了個樣,用兩顆相對工藝不那么先進的芯片,封裝在一起,使得性能翻倍了。龍芯這顆芯片叫做3D5000,是通過兩顆3C5000芯片,封測在一起而實現(xiàn)的。
3C5000芯片,采用12nm工藝,內(nèi)部集成 16 個高性能的龍芯 LA 464 核心,單芯片雙精度浮點峰值運算速度超過 0.5TFLOPS。
而將兩顆3C5000芯片封裝在一起后,變成了內(nèi)部集成32個高性能核心了,變成了32核,而多核性能上,相比于3C5000,性能直接翻倍。
3D5000性能戰(zhàn)Zen2?
此次龍芯發(fā)布的3D5000與去年發(fā)布的3C5000同屬一個系列,實質(zhì)上就是將兩顆3C5000核心封裝在一起,通過特殊的連接協(xié)議使其成為一顆單獨的處理器,類似的設(shè)計思路在半導(dǎo)體行業(yè)中并不少見,一般會被網(wǎng)友稱之為“膠水核”。
雖然這種設(shè)計方式看起來簡單且粗暴,但是設(shè)計合理,那么就可以輕松提升單顆處理器的性能上限。當(dāng)然,缺點也是明顯的,一方面是雙核封裝會帶來功耗的飆升,另一方面則是封裝體積過大,不適用于普通民用市場。
所以,3D5000與3C5000的定位不同,將主要面向服務(wù)器市場,不會在消費級市場發(fā)售。作為基礎(chǔ)核心的3C5000,性能并不弱,早前小雷也專門進行過一次報道,3C5000采用16核心設(shè)計,主頻為2.0GHz-2.2GHz,unixbench分?jǐn)?shù)達到95000分以上,雙精度計算能力可達560GFlops,峰值性能與典型ARM 64核處理器相當(dāng)。
那么封裝了兩個3C5000的性能又如何呢?從官方給出的參數(shù)來看,3D5000采用32核設(shè)計,集成64MB L3緩存,支持最多8個DDR4-3200 DRAM,同時支持HyperTransport接口,最多可以支持四路處理器互聯(lián),單主板最高可以提供128核的運算支持。
另外,從目前的測試結(jié)果來看,單就IPC性能而言基本上是持平了同主頻且核心數(shù)相同的Zen2 EPIC處理器,但是對于Zen2 EPIC處理器而言,3D5000的最高2.2GHz僅僅是勉強摸到了同核心數(shù)處理器的下限,比如EPYC 7452的基準(zhǔn)頻率就達2.35GHz,加速頻率可達3.35GHz。
或許看完數(shù)據(jù)對比,大家會對龍芯的性能感到悲觀,但是從產(chǎn)業(yè)發(fā)展角度來說,其實已經(jīng)是一個很大的進步,而且3C5000與Zen2系列處理器使用的制程工藝并非一個世代的,前者為12nm工藝,后者則是7nm工藝,架構(gòu)+主頻的差距,使得3C5000主頻表現(xiàn)疲弱,而這并不是無法解決的。
3D5000能否撐起國產(chǎn)服務(wù)器需求?
在實測性能方面,官方給出了單路和雙路的SPEC CPU2006 Base測試結(jié)果,在實測中單路得分超過400,雙路得分超過800,在完整的四路配置下,預(yù)計SPEC CPU2006 Base分?jǐn)?shù)可以達到1600分,基本上與英特爾的至強E5 2699 V4性能持平。
從目前的性能來看,3D5000已經(jīng)可以取代部分英特爾的至強處理器,活躍在一些服務(wù)器和軟件部署場景之中。當(dāng)然,理智上講,兩者的區(qū)別依然巨大,但是至強系列本就是世界領(lǐng)先的服務(wù)器處理器,E5-2699 V4作為一款2016年推出的中高端產(chǎn)品,其性能還是頗為可觀的。
當(dāng)然,如果對比最近兩年發(fā)布的處理器,那么不管是3D5000還是E5-2699 V4都相形見絀,自從在架構(gòu)上取得突破后,英特爾和AMD的新一代處理器性能就以前所未有的速度向前狂奔,幾乎淘汰了2019年之前的所有處理器。
即使是在服務(wù)器領(lǐng)域,新架構(gòu)的服務(wù)器處理器在核心數(shù)、主頻和IPC性能等方面都有著恐怖的提升。以AMD在2019年針對個人服務(wù)器市場推出的線程撕裂者3960X為例,在多核性能上已經(jīng)被英特爾在2022年發(fā)布的i9-13900K擊敗,而后者只是一顆面向個人消費市場的處理器。
迅猛發(fā)展的處理器性能正在加速甩開其他競爭對手,但就目前的發(fā)展趨勢來看,國產(chǎn)處理器想要完全取代英特爾和AMD是不可能的,至少在超大型服務(wù)器和個人工作站領(lǐng)域,英特爾和AMD仍然是目前國內(nèi)大多數(shù)公司和用戶的最好的選擇。
那么3D5000就沒有意義了?當(dāng)然不是,作為一顆服務(wù)器處理器,其性能已經(jīng)足夠應(yīng)付一般的信創(chuàng)服務(wù)器部署需要,在一些關(guān)鍵場所和機要部門,可以完全杜絕海外硬件的使用,帶來更高的安全性能。
此外,龍芯的產(chǎn)品計劃中,3C6000將會達到更高的IPC性能和主頻,甚至可以真正匹敵Zen2架構(gòu)的AMD EPIC處理器,想要做到這點,意味著3C6000的主頻至少需要提高到2.5GHz,對于龍芯來說是一個艱難的任務(wù)。
而在更久遠(yuǎn)的7000系列處理器規(guī)劃中,龍芯希望可以借助7nm工藝將處理器的IPC性能推進到Zen3和12代酷睿處理器的水平。雖然從現(xiàn)在看來八字還沒一撇,但是已經(jīng)初步驗證了架構(gòu)的可行性,只要相關(guān)制程工藝跟上就有機會實現(xiàn)這個目標(biāo)。
在龍芯的計劃中,7000系列將會提供單個24-32核的3D7000和48-64核的3E7000,后者或?qū)⒂蓛深w3D7000組合而成,屆時性能或許將可以持平國外主流服務(wù)器處理,使得中低端服務(wù)器的搭建不再依賴于國外產(chǎn)品。
不過,即使在硬件性能方面追上英特爾和AMD,對于龍芯來說還有許多問題需要解決。首先,龍芯使用的并非x86架構(gòu),而是一個全新的自研處理器架構(gòu),意味著大量的主流專業(yè)軟件都將無法正常運行在龍芯的處理器環(huán)境中。
在服務(wù)器等專業(yè)領(lǐng)域,失去了專業(yè)軟件的支持基本上就失去了主流市場,這也是ARM處理器即使在能效比等方面表現(xiàn)出色,依然無法搶占x86市場的原因,許多專業(yè)軟件都僅僅針對x86架構(gòu)做了優(yōu)化,如果想通過編譯等方式使其運行在新環(huán)境下,會面對性能損失、穩(wěn)定性下降等問題。
如果龍芯想要進入商用服務(wù)器市場,那么在軟件生態(tài)適配方面也要下功夫,單顆硬件性能是無法站穩(wěn)商用市場的。當(dāng)然,我知道現(xiàn)在談龍芯的商用發(fā)展還為時尚早,龍芯目前更多的是服務(wù)于政府等對國產(chǎn)化要求高的行業(yè)和領(lǐng)域,對于商業(yè)公司來說沒有必要也不需要采購龍芯來設(shè)計部署服務(wù)器。
而且,龍芯也在推進軟件生態(tài)的發(fā)展,比如通過二進制編譯器來翻譯兼容x86生態(tài)中的軟件,與國產(chǎn)系統(tǒng)合作,推動系統(tǒng)和軟件的適配等,隨著使用者的增加,相信在未來可以構(gòu)建出屬于自己的架構(gòu)生態(tài)。
目前,ARM是全球第一大芯片IP授權(quán)服務(wù)商,在移動CPU市場占比超90%的企業(yè),中國芯片設(shè)計公司大多采用ARM架構(gòu),來設(shè)計手機和服務(wù)器芯片。然而因為中國芯片的發(fā)展速度太快,美國還是坐不住了,再次玩起了限制的把戲。
而龍芯最大的優(yōu)勢在于,擁有自主知識產(chǎn)權(quán)的架構(gòu),不受任何外力限制,而且100%安全。
相比于消費級CPU,服務(wù)器CPU更為重要,它被廣泛的用于數(shù)據(jù)中心、云計算中心等場景,這里存儲著大量與國家、民生、經(jīng)濟等方面的數(shù)據(jù),事關(guān)信息安全問題。
所以可以預(yù)見,數(shù)據(jù)中心的國產(chǎn)化替代,將會迎來提速,取代主流的X86架構(gòu)、ARM架構(gòu)的服務(wù)器產(chǎn)品,已經(jīng)勢在必行,龍芯也將獲得巨大的發(fā)展空間。
總之,有了龍芯,我們已經(jīng)有了十足的底氣面對各個方面的壓力。所以也讓我們一起祝福龍芯,在2023年能夠有更好的發(fā)展,為國家的信息安全,繼續(xù)做出更多的貢獻,加油。
