HBM3來(lái)了！HBM未來(lái)潛力與演進(jìn)方向在哪？

2023-01-09 來(lái)源：網(wǎng)絡(luò)整理

2520

由于處理器與存儲(chǔ)器的工藝、封裝、需求的不同，從1980年開始至今二者之間的性能差距越來(lái)越大。有數(shù)據(jù)顯示，處理器和存儲(chǔ)器的速度失配以每年50%的速率增加。

存儲(chǔ)器數(shù)據(jù)訪問(wèn)速度跟不上處理器的數(shù)據(jù)處理速度，數(shù)據(jù)傳輸就像處在一個(gè)巨大的漏斗之中，不管處理器灌進(jìn)去多少，存儲(chǔ)器都只能“細(xì)水長(zhǎng)流”。兩者之間數(shù)據(jù)交換通路窄以及由此引發(fā)的高能耗兩大難題，在存儲(chǔ)與運(yùn)算之間筑起了一道“內(nèi)存墻”。

隨著數(shù)據(jù)的爆炸勢(shì)增長(zhǎng)，內(nèi)存墻對(duì)于計(jì)算速度的影響愈發(fā)顯現(xiàn)。為了減小內(nèi)存墻的影響，提升內(nèi)存帶寬一直是存儲(chǔ)芯片聚焦的關(guān)鍵問(wèn)題。

長(zhǎng)期以來(lái)，內(nèi)存行業(yè)的價(jià)值主張?jiān)诤艽蟪潭壬鲜冀K以系統(tǒng)級(jí)需求為導(dǎo)向，已經(jīng)突破了系統(tǒng)性能的當(dāng)前極限。很明顯的一點(diǎn)是，內(nèi)存性能的提升將出現(xiàn)拐點(diǎn)，因?yàn)樵絹?lái)越多人開始質(zhì)疑是否能一直通過(guò)內(nèi)存級(jí)的取舍（如功耗、散熱、占板空間等）來(lái)提高系統(tǒng)性能。

基于對(duì)先進(jìn)技術(shù)和解決方案開展的研究，內(nèi)存行業(yè)在新領(lǐng)域進(jìn)行了更深入的探索。作為存儲(chǔ)器市場(chǎng)的重要組成部分，DRAM技術(shù)不斷地升級(jí)衍生。DRAM從2D向3D技術(shù)發(fā)展，其中HBM是主要代表產(chǎn)品。

HBM（High Bandwidth Memory，高帶寬內(nèi)存）是一款新型的CPU/GPU 內(nèi)存芯片，其實(shí)就是將很多個(gè)DDR芯片堆疊在一起后和GPU封裝在一起，實(shí)現(xiàn)大容量，高位寬的DDR組合陣列。

通過(guò)增加帶寬，擴(kuò)展內(nèi)存容量，讓更大的模型，更多的參數(shù)留在離核心計(jì)算更近的地方，從而減少內(nèi)存和存儲(chǔ)解決方案帶來(lái)的延遲。

從技術(shù)角度看，HBM使DRAM從傳統(tǒng)2D轉(zhuǎn)變?yōu)榱Ⅲw3D，充分利用空間、縮小面積，契合半導(dǎo)體行業(yè)小型化、集成化的發(fā)展趨勢(shì)。HBM突破了內(nèi)存容量與帶寬瓶頸，被視為新一代DRAM解決方案，業(yè)界認(rèn)為這是DRAM通過(guò)存儲(chǔ)器層次結(jié)構(gòu)的多樣化開辟一條新的道路，革命性提升DRAM的性能。

在內(nèi)存領(lǐng)域，一場(chǎng)關(guān)于HBM的競(jìng)賽已悄然打響。

為什么HBM很重要

自HBM首次宣布以來(lái)的十年里，已有2.5代標(biāo)準(zhǔn)進(jìn)入市場(chǎng)。在此期間，創(chuàng)建、捕獲、復(fù)制和消耗的數(shù)據(jù)量從2010年的2 ZB增加到2020年的64.2 ZB，據(jù)Statista預(yù)測(cè)，這一數(shù)字將在2025年增長(zhǎng)近三倍，達(dá)到181 ZB。

Synopsys的高級(jí)產(chǎn)品營(yíng)銷經(jīng)理Anika Malhotra表示：“2016年，HBM2將信令速率提高了一倍，達(dá)到2 Gbps，帶寬達(dá)到256 GB/s。兩年后，HBM2E出現(xiàn)了，實(shí)現(xiàn)了3.6 Gbps和460 GB/s的數(shù)據(jù)速率。性能需求在增加，高級(jí)工作負(fù)載對(duì)帶寬的需求也在增加，因?yàn)楦叩膬?nèi)存帶寬是實(shí)現(xiàn)計(jì)算性能的關(guān)鍵因素。”

“除此之外，為了更快地處理所有這些數(shù)據(jù)，芯片設(shè)計(jì)也變得越來(lái)越復(fù)雜，通常需要專門的加速器、片內(nèi)或封裝內(nèi)存儲(chǔ)器及接口。HBM被視為將異構(gòu)分布式處理推到一個(gè)完全不同水平的一種方式。”

“最初，高帶寬內(nèi)存只是被圖形公司視為進(jìn)化方向上的一步；但是后來(lái)網(wǎng)絡(luò)和數(shù)據(jù)中心意識(shí)到HBM可以為內(nèi)存結(jié)構(gòu)帶來(lái)更多的帶寬。所有推動(dòng)數(shù)據(jù)中心采用HBM的動(dòng)力在于更低延遲、更快訪問(wèn)和更低功耗?！盡alhotra說(shuō)。“通常情況下，CPU為內(nèi)存容量進(jìn)行優(yōu)化，而加速器和GPU為內(nèi)存帶寬進(jìn)行優(yōu)化。但是隨著模型尺寸的指數(shù)增長(zhǎng)，系統(tǒng)對(duì)容量和帶寬的需求同時(shí)在增長(zhǎng)（即不會(huì)因?yàn)樵黾尤萘亢螅瑢?duì)帶寬需求降低）。我們看到更多的內(nèi)存分層，包括支持對(duì)軟件可見的HBM + DDR，以及使用HBM作為DDR的軟件透明緩存。除了CPU和GPU， HBM也很受數(shù)據(jù)中心FPGA的歡迎?！?/span>

HBM最初的目的是替代GDDR等其他內(nèi)存，由一些領(lǐng)先的半導(dǎo)體公司（特別是英偉達(dá)和AMD）推動(dòng)。這些公司仍然在JEDEC工作組中大力推動(dòng)其發(fā)展，英偉達(dá)是該工作組的主席，AMD是主要貢獻(xiàn)者之一。

Synopsys產(chǎn)品營(yíng)銷經(jīng)理Brett Murdock表示：“GPU目前有兩種選擇。一種是繼續(xù)使用GDDR，這種在SoC周圍會(huì)有大量的外設(shè)；另一種是使用HBM，可以讓用戶獲得更多的帶寬和更少的物理接口，但是整體成本相對(duì)更高。還有一點(diǎn)需要強(qiáng)調(diào)的是物理接口越少，功耗越低。所以使用GDDR非常耗電，而HBM非常節(jié)能。所以說(shuō)到底，客戶真正想問(wèn)的是花錢的首要任務(wù)是什么？對(duì)于HBM3，已經(jīng)開始讓答案朝‘可能應(yīng)該把錢花在HBM上’傾斜?！?/span>

盡管在最初推出時(shí)，HBM 2/2e僅面向AMD和Nvidia這兩家公司，但現(xiàn)在它已經(jīng)擁有了龐大的用戶基礎(chǔ)。當(dāng)HBM3最終被JEDEC批準(zhǔn)時(shí)，這種增長(zhǎng)有望大幅擴(kuò)大。

HBM3性能未來(lái)可期

HBM3帶來(lái)的性能提升大家應(yīng)該都比較清楚了，傳輸速率是HBM2的兩倍，達(dá)到了6.4Gb/s，使得每個(gè)堆棧最高可達(dá)819GB/s的帶寬。可用的獨(dú)立通道也從HBM2的8個(gè)擴(kuò)充至16個(gè)，加上每個(gè)通道兩個(gè)偽通道的設(shè)計(jì)，HBM3可以說(shuō)支持到32通道了，提供更優(yōu)秀的時(shí)序來(lái)提升系統(tǒng)性能。

HBM3的TSV堆疊層數(shù)支持4-high、8-high和12-high，這倒是和HBM2e沒有什么差別。從SK海力士提供的機(jī)械結(jié)構(gòu)圖來(lái)看，無(wú)論是8Hi還是12Hi，其封裝大小和高度都是一樣的，只不過(guò)是減小了中間堆疊的裸片高度。這僅僅是第一代HBM3，未來(lái)HBM3會(huì)擴(kuò)展至16-high的TSV堆棧，單設(shè)備的內(nèi)存密度范圍也將達(dá)到4GB至64GB，不過(guò)第一代HBM3設(shè)備的話，目前用到的依然是16GB的內(nèi)存層。

此外，在散熱上，通過(guò)增加dummy bump、增加HBM3裸片大小并降低間隙高度，HBM3成功將溫度降低了25%，實(shí)現(xiàn)了更好的散熱性能。在7位ADC的支持下，HBM3的溫度傳感器也能以1℃的分辨率輸出0到127℃的溫度信息。

HBM未來(lái)潛力與演進(jìn)方向

對(duì)于接下來(lái)的規(guī)劃策略和技術(shù)進(jìn)步，業(yè)界旨在突破目前HBM在速度、密度、功耗、占板空間等方面的極限。

首先，為了打破速度極限，SK海力士正在評(píng)估提高引腳數(shù)據(jù)速率的傳統(tǒng)方法的利弊，以及超過(guò)1024個(gè)數(shù)據(jù)的I/O總線位寬，以實(shí)現(xiàn)更好的數(shù)據(jù)并行性和向后設(shè)計(jì)兼容性。簡(jiǎn)單來(lái)講，即用最少的取舍獲得更高的帶寬性能。

針對(duì)更大數(shù)據(jù)集、訓(xùn)練工作負(fù)載所需的更高內(nèi)存密度要求，存儲(chǔ)廠商開始著手研究擴(kuò)展Die堆疊層數(shù)和物理堆疊高度，以及增加核心Die密度以優(yōu)化堆疊密度。

另一方面也在致力于提高功耗效率，通過(guò)評(píng)估從最低微結(jié)構(gòu)級(jí)別到最高Die堆疊概念的內(nèi)存結(jié)構(gòu)和操作方案，最大限度地降低每帶寬擴(kuò)展的絕對(duì)功耗。由于現(xiàn)有中介層光罩尺寸的物理限制以及支持處理單元和HBM Cube的其他相關(guān)技術(shù)，實(shí)現(xiàn)總內(nèi)存Die尺寸最小化尤為重要。因此，行業(yè)廠商需要在不擴(kuò)大現(xiàn)有物理尺寸的情況下增加存儲(chǔ)單元數(shù)量和功能，從而實(shí)現(xiàn)整體性能的飛躍。

但從產(chǎn)業(yè)發(fā)展歷程來(lái)看，完成上述任務(wù)的前提是：存儲(chǔ)廠商要與上下游生態(tài)系統(tǒng)合作伙伴攜手合作和開放協(xié)同，將HBM的使用范圍從現(xiàn)有系統(tǒng)擴(kuò)展到潛在的下一代應(yīng)用。

此外，新型HBM-PIM（存內(nèi)計(jì)算）芯片將AI引擎引入每個(gè)存儲(chǔ)庫(kù)，從而將處理操作轉(zhuǎn)移到HBM。

在傳統(tǒng)架構(gòu)下，數(shù)據(jù)從內(nèi)存單元傳輸?shù)接?jì)算單元需要的功耗是計(jì)算本身的約200倍，數(shù)據(jù)的搬運(yùn)耗費(fèi)的功耗遠(yuǎn)大于計(jì)算，因此真正用于計(jì)算的能耗和時(shí)間占比很低，數(shù)據(jù)在存儲(chǔ)器與處理器之間的頻繁遷移帶來(lái)嚴(yán)重的傳輸功耗問(wèn)題，稱為“功耗墻”。新型的內(nèi)存旨在減輕在內(nèi)存和處理器之間搬運(yùn)數(shù)據(jù)的負(fù)擔(dān)。

寫在最后

過(guò)去幾年來(lái)，HBM產(chǎn)品帶寬增加了數(shù)倍，目前已接近或達(dá)到1TB/秒的里程碑節(jié)點(diǎn)。相較于同期內(nèi)其他產(chǎn)品僅增加兩三倍的帶寬增速，HBM的快速發(fā)展歸功于存儲(chǔ)器制造商之間的競(jìng)爭(zhēng)和比拼。

存儲(chǔ)器帶寬指單位時(shí)間內(nèi)可以傳輸?shù)臄?shù)據(jù)量，要想增加帶寬，最簡(jiǎn)單的方法是增加數(shù)據(jù)傳輸線路的數(shù)量。事實(shí)上，每個(gè)HBM由多達(dá)1024個(gè)數(shù)據(jù)引腳組成，HBM內(nèi)部的數(shù)據(jù)傳輸路徑隨著每一代產(chǎn)品的發(fā)展而顯著增長(zhǎng)。

回顧HBM的演進(jìn)歷程，第一代HBM數(shù)據(jù)傳輸速率大概可達(dá)1Gbps；2016年推出的第二代產(chǎn)品HBM2，最高數(shù)據(jù)傳輸速率可達(dá)2Gbps；2018年，第三代產(chǎn)品HBM2E的最高數(shù)據(jù)傳輸速率已經(jīng)可達(dá)3.6Gbps。如今，SK海力士和三星已研發(fā)出第四代產(chǎn)品HBM3，此后HBM3預(yù)計(jì)仍將持續(xù)發(fā)力，在數(shù)據(jù)傳輸速率上有更大的提升。

從性能來(lái)看，HBM無(wú)疑是出色的，其在數(shù)據(jù)傳輸?shù)乃俾?、帶寬以及密度上都有著巨大的?yōu)勢(shì)。不過(guò)，目前HBM仍主要應(yīng)用于服務(wù)器、數(shù)據(jù)中心等應(yīng)用領(lǐng)域，其最大的限制條件在于成本，對(duì)成本比較敏感的消費(fèi)領(lǐng)域而言，HBM的使用門檻仍較高。

盡管HBM已更迭到了第四代，但HBM現(xiàn)在依舊處于相對(duì)早期的階段，其未來(lái)還有很長(zhǎng)的一段路要走。

而可預(yù)見的是，隨著人工智能、機(jī)器學(xué)習(xí)、高性能計(jì)算、數(shù)據(jù)中心等應(yīng)用市場(chǎng)的興起，內(nèi)存產(chǎn)品設(shè)計(jì)的復(fù)雜性正在快速上升，并對(duì)帶寬提出了更高的要求，不斷上升的寬帶需求持續(xù)驅(qū)動(dòng)HBM發(fā)展。市場(chǎng)調(diào)研機(jī)構(gòu)Omdia預(yù)測(cè)，2025年HBM市場(chǎng)的總收入將達(dá)到25億美元。

在這個(gè)過(guò)程中，存儲(chǔ)巨頭持續(xù)發(fā)力、上下游廠商相繼入局，HBM將受到越來(lái)越多的關(guān)注與青睞。