龍芯3D5000研發(fā)成功，能和AMD扳手腕嗎？

2023-02-01 來源：電子芯技術(shù)

1810

前段時(shí)間，有機(jī)構(gòu)發(fā)布了一個(gè)2022年3季度全球智能手機(jī)AP數(shù)據(jù)，數(shù)據(jù)顯示華為麒麟芯片真的用光了，市場(chǎng)份額已經(jīng)2季度的0.4%，變成了0%。

事實(shí)上，這個(gè)也在大家的意料之中，因?yàn)樽?020年9月15日后，華為麒麟芯片就成為了絕唱，沒有代工廠了，只能靠庫存撐著，自然有用光的一天。

有人表示，華為苦等兩年，沒有等來解封，也沒有等來突破封鎖的“奇跡”，真是可惜。

確實(shí)從現(xiàn)在的情況來看，雖然“奇跡”沒有等來，等眾多企業(yè)的努力，還是沒有白費(fèi)，這些企業(yè)的努力，或深遠(yuǎn)的影響著未來全球芯片的格局。

華為海思提出的芯片堆疊技術(shù)，現(xiàn)在來看，暫時(shí)沒有成為華為突破芯片封鎖的技術(shù)，但通過一些企業(yè)的驗(yàn)證，未來還是有希望的。

比如龍芯，近日就給華為打了個(gè)樣，用兩顆相對(duì)工藝不那么先進(jìn)的芯片，封裝在一起，使得性能翻倍了。龍芯這顆芯片叫做3D5000，是通過兩顆3C5000芯片，封測(cè)在一起而實(shí)現(xiàn)的。

3C5000芯片，采用12nm工藝，內(nèi)部集成 16 個(gè)高性能的龍芯 LA 464 核心，單芯片雙精度浮點(diǎn)峰值運(yùn)算速度超過 0.5TFLOPS。

而將兩顆3C5000芯片封裝在一起后，變成了內(nèi)部集成32個(gè)高性能核心了，變成了32核，而多核性能上，相比于3C5000，性能直接翻倍。

3D5000性能戰(zhàn)Zen2？

此次龍芯發(fā)布的3D5000與去年發(fā)布的3C5000同屬一個(gè)系列，實(shí)質(zhì)上就是將兩顆3C5000核心封裝在一起，通過特殊的連接協(xié)議使其成為一顆單獨(dú)的處理器，類似的設(shè)計(jì)思路在半導(dǎo)體行業(yè)中并不少見，一般會(huì)被網(wǎng)友稱之為“膠水核”。

雖然這種設(shè)計(jì)方式看起來簡單且粗暴，但是設(shè)計(jì)合理，那么就可以輕松提升單顆處理器的性能上限。當(dāng)然，缺點(diǎn)也是明顯的，一方面是雙核封裝會(huì)帶來功耗的飆升，另一方面則是封裝體積過大，不適用于普通民用市場(chǎng)。

所以，3D5000與3C5000的定位不同，將主要面向服務(wù)器市場(chǎng)，不會(huì)在消費(fèi)級(jí)市場(chǎng)發(fā)售。作為基礎(chǔ)核心的3C5000，性能并不弱，早前小雷也專門進(jìn)行過一次報(bào)道，3C5000采用16核心設(shè)計(jì)，主頻為2.0GHz-2.2GHz，unixbench分?jǐn)?shù)達(dá)到95000分以上，雙精度計(jì)算能力可達(dá)560GFlops，峰值性能與典型ARM 64核處理器相當(dāng)。

那么封裝了兩個(gè)3C5000的性能又如何呢？從官方給出的參數(shù)來看，3D5000采用32核設(shè)計(jì)，集成64MB L3緩存，支持最多8個(gè)DDR4-3200 DRAM，同時(shí)支持HyperTransport接口，最多可以支持四路處理器互聯(lián)，單主板最高可以提供128核的運(yùn)算支持。

另外，從目前的測(cè)試結(jié)果來看，單就IPC性能而言基本上是持平了同主頻且核心數(shù)相同的Zen2 EPIC處理器，但是對(duì)于Zen2 EPIC處理器而言，3D5000的最高2.2GHz僅僅是勉強(qiáng)摸到了同核心數(shù)處理器的下限，比如EPYC 7452的基準(zhǔn)頻率就達(dá)2.35GHz，加速頻率可達(dá)3.35GHz。

或許看完數(shù)據(jù)對(duì)比，大家會(huì)對(duì)龍芯的性能感到悲觀，但是從產(chǎn)業(yè)發(fā)展角度來說，其實(shí)已經(jīng)是一個(gè)很大的進(jìn)步，而且3C5000與Zen2系列處理器使用的制程工藝并非一個(gè)世代的，前者為12nm工藝，后者則是7nm工藝，架構(gòu)+主頻的差距，使得3C5000主頻表現(xiàn)疲弱，而這并不是無法解決的。

3D5000能否撐起國產(chǎn)服務(wù)器需求？

在實(shí)測(cè)性能方面，官方給出了單路和雙路的SPEC CPU2006 Base測(cè)試結(jié)果，在實(shí)測(cè)中單路得分超過400，雙路得分超過800，在完整的四路配置下，預(yù)計(jì)SPEC CPU2006 Base分?jǐn)?shù)可以達(dá)到1600分，基本上與英特爾的至強(qiáng)E5 2699 V4性能持平。

從目前的性能來看，3D5000已經(jīng)可以取代部分英特爾的至強(qiáng)處理器，活躍在一些服務(wù)器和軟件部署場(chǎng)景之中。當(dāng)然，理智上講，兩者的區(qū)別依然巨大，但是至強(qiáng)系列本就是世界領(lǐng)先的服務(wù)器處理器，E5-2699 V4作為一款2016年推出的中高端產(chǎn)品，其性能還是頗為可觀的。

當(dāng)然，如果對(duì)比最近兩年發(fā)布的處理器，那么不管是3D5000還是E5-2699 V4都相形見絀，自從在架構(gòu)上取得突破后，英特爾和AMD的新一代處理器性能就以前所未有的速度向前狂奔，幾乎淘汰了2019年之前的所有處理器。

即使是在服務(wù)器領(lǐng)域，新架構(gòu)的服務(wù)器處理器在核心數(shù)、主頻和IPC性能等方面都有著恐怖的提升。以AMD在2019年針對(duì)個(gè)人服務(wù)器市場(chǎng)推出的線程撕裂者3960X為例，在多核性能上已經(jīng)被英特爾在2022年發(fā)布的i9-13900K擊敗，而后者只是一顆面向個(gè)人消費(fèi)市場(chǎng)的處理器。

迅猛發(fā)展的處理器性能正在加速甩開其他競爭對(duì)手，但就目前的發(fā)展趨勢(shì)來看，國產(chǎn)處理器想要完全取代英特爾和AMD是不可能的，至少在超大型服務(wù)器和個(gè)人工作站領(lǐng)域，英特爾和AMD仍然是目前國內(nèi)大多數(shù)公司和用戶的最好的選擇。

那么3D5000就沒有意義了？當(dāng)然不是，作為一顆服務(wù)器處理器，其性能已經(jīng)足夠應(yīng)付一般的信創(chuàng)服務(wù)器部署需要，在一些關(guān)鍵場(chǎng)所和機(jī)要部門，可以完全杜絕海外硬件的使用，帶來更高的安全性能。

此外，龍芯的產(chǎn)品計(jì)劃中，3C6000將會(huì)達(dá)到更高的IPC性能和主頻，甚至可以真正匹敵Zen2架構(gòu)的AMD EPIC處理器，想要做到這點(diǎn)，意味著3C6000的主頻至少需要提高到2.5GHz，對(duì)于龍芯來說是一個(gè)艱難的任務(wù)。

而在更久遠(yuǎn)的7000系列處理器規(guī)劃中，龍芯希望可以借助7nm工藝將處理器的IPC性能推進(jìn)到Zen3和12代酷睿處理器的水平。雖然從現(xiàn)在看來八字還沒一撇，但是已經(jīng)初步驗(yàn)證了架構(gòu)的可行性，只要相關(guān)制程工藝跟上就有機(jī)會(huì)實(shí)現(xiàn)這個(gè)目標(biāo)。

在龍芯的計(jì)劃中，7000系列將會(huì)提供單個(gè)24-32核的3D7000和48-64核的3E7000，后者或?qū)⒂蓛深w3D7000組合而成，屆時(shí)性能或許將可以持平國外主流服務(wù)器處理，使得中低端服務(wù)器的搭建不再依賴于國外產(chǎn)品。

不過，即使在硬件性能方面追上英特爾和AMD，對(duì)于龍芯來說還有許多問題需要解決。首先，龍芯使用的并非x86架構(gòu)，而是一個(gè)全新的自研處理器架構(gòu)，意味著大量的主流專業(yè)軟件都將無法正常運(yùn)行在龍芯的處理器環(huán)境中。

在服務(wù)器等專業(yè)領(lǐng)域，失去了專業(yè)軟件的支持基本上就失去了主流市場(chǎng)，這也是ARM處理器即使在能效比等方面表現(xiàn)出色，依然無法搶占x86市場(chǎng)的原因，許多專業(yè)軟件都僅僅針對(duì)x86架構(gòu)做了優(yōu)化，如果想通過編譯等方式使其運(yùn)行在新環(huán)境下，會(huì)面對(duì)性能損失、穩(wěn)定性下降等問題。

如果龍芯想要進(jìn)入商用服務(wù)器市場(chǎng)，那么在軟件生態(tài)適配方面也要下功夫，單顆硬件性能是無法站穩(wěn)商用市場(chǎng)的。當(dāng)然，我知道現(xiàn)在談龍芯的商用發(fā)展還為時(shí)尚早，龍芯目前更多的是服務(wù)于政府等對(duì)國產(chǎn)化要求高的行業(yè)和領(lǐng)域，對(duì)于商業(yè)公司來說沒有必要也不需要采購龍芯來設(shè)計(jì)部署服務(wù)器。

而且，龍芯也在推進(jìn)軟件生態(tài)的發(fā)展，比如通過二進(jìn)制編譯器來翻譯兼容x86生態(tài)中的軟件，與國產(chǎn)系統(tǒng)合作，推動(dòng)系統(tǒng)和軟件的適配等，隨著使用者的增加，相信在未來可以構(gòu)建出屬于自己的架構(gòu)生態(tài)。

目前，ARM是全球第一大芯片IP授權(quán)服務(wù)商，在移動(dòng)CPU市場(chǎng)占比超90%的企業(yè)，中國芯片設(shè)計(jì)公司大多采用ARM架構(gòu)，來設(shè)計(jì)手機(jī)和服務(wù)器芯片。然而因?yàn)橹袊酒陌l(fā)展速度太快，美國還是坐不住了，再次玩起了限制的把戲。

而龍芯最大的優(yōu)勢(shì)在于，擁有自主知識(shí)產(chǎn)權(quán)的架構(gòu)，不受任何外力限制，而且100%安全。

相比于消費(fèi)級(jí)CPU，服務(wù)器CPU更為重要，它被廣泛的用于數(shù)據(jù)中心、云計(jì)算中心等場(chǎng)景，這里存儲(chǔ)著大量與國家、民生、經(jīng)濟(jì)等方面的數(shù)據(jù)，事關(guān)信息安全問題。

所以可以預(yù)見，數(shù)據(jù)中心的國產(chǎn)化替代，將會(huì)迎來提速，取代主流的X86架構(gòu)、ARM架構(gòu)的服務(wù)器產(chǎn)品，已經(jīng)勢(shì)在必行，龍芯也將獲得巨大的發(fā)展空間。

總之，有了龍芯，我們已經(jīng)有了十足的底氣面對(duì)各個(gè)方面的壓力。所以也讓我們一起祝福龍芯，在2023年能夠有更好的發(fā)展，為國家的信息安全，繼續(xù)做出更多的貢獻(xiàn)，加油。