英偉達(dá)將引入Chiplet實(shí)現(xiàn)高性能AI芯片,這種材料需求量爆發(fā)
Chiplet對(duì) Nvidia 來(lái)說(shuō)并不陌生。該公告還為Chiplet作為一個(gè)概念增加了更多驗(yàn)證——許多半導(dǎo)體制造商都指望這一概念在未來(lái)幾年幫助保持摩爾定律的活力。
小芯片背后的想法幾乎不是一個(gè)新概念。幾十年來(lái),該行業(yè)一直在制造多芯片模塊:例如,Mostek 在 1979 年將兩個(gè) MK4116 16-Kbit DRAM 芯片放入雙腔陶瓷封裝中,創(chuàng)建了 MK4332D 32Kbit DRAM。英特爾還將 CPU 芯片和一個(gè)1995 年底推出的 Pentium Pro 中的 SRAM 芯片。這些多芯片模塊 (MCM) 使 Mostek 和 Intel 能夠超越其半導(dǎo)體工藝的局限,創(chuàng)造出“超越摩爾”的封裝設(shè)備。
Chiplets 的兩大優(yōu)勢(shì)
Xilinx Virtex-7 2000T 和 580HT 展示了小芯片提供的兩個(gè)最大優(yōu)勢(shì)。
對(duì)于 Virtex-7 2000T,使用硅中介層將四個(gè) 28 納米 FPGA 小芯片組裝到一個(gè)封裝中,使 Xilinx 能夠構(gòu)建更大的 FPGA,這可以通過(guò)單片 28 納米芯片實(shí)現(xiàn)。中介層允許半導(dǎo)體制造商通過(guò)將大型芯片組裝成比單個(gè)芯片可能更大的馬賽克來(lái)超越晶圓步進(jìn)機(jī)的光罩限制。
Virtex-7 580HT 刪除了 Virtex-7 2000T 的四個(gè) FPGA 小芯片之一,并用 28Gbps 收發(fā)器小芯片取而代之,當(dāng)時(shí)無(wú)法使用主流 28nm 數(shù)字 CMOS 工藝制造 28Gbps 收發(fā)器FPGA小芯片。
因此,小芯片提供的第二個(gè)優(yōu)勢(shì)是能夠混合和匹配使用不同工藝節(jié)點(diǎn)制造的芯片,很可能來(lái)自不同的代工廠。與主流和前沿?cái)?shù)字工藝節(jié)點(diǎn)明顯不同的重要工藝節(jié)點(diǎn)包括模擬工藝、內(nèi)存工藝(例如 DRAM 工藝,特別是高帶寬內(nèi)存(HBM)內(nèi)存堆棧的形式)和高電流或高電壓工藝——尤其是特殊工藝,例如用于光子學(xué)的砷化鎵 (GaAs) 和用于功率半導(dǎo)體的碳化硅 (SiC)。
Chiplet:AI 芯片算力破局之路
伴隨摩爾定律逼近物理極限,提升制程工藝和芯片面積將面臨大幅的良率下降、成本增加,性能提升收益邊際降低。此外,2022 年 10 月以來(lái),美國(guó)持續(xù)對(duì)國(guó)內(nèi)半導(dǎo)體產(chǎn)業(yè)施壓,限制中國(guó)獲取先進(jìn)制程芯片產(chǎn)品和代工服務(wù),對(duì)于國(guó)內(nèi) AI 芯片廠商而言,架構(gòu)創(chuàng)新或?qū)⒊蔀樘嵘懔α肀脔鑿降倪x擇。
chiplet 工藝讓我們看到通過(guò)架構(gòu)創(chuàng)新實(shí)現(xiàn)算力跨越的可能,國(guó)內(nèi)AI 芯片廠商亦已經(jīng)進(jìn)行了成功嘗試。
2022 年 8 月,國(guó)產(chǎn) GPU 廠商壁仞科技發(fā)布 BR100 系列 GPU,其采用 7nm 制程,實(shí)現(xiàn)了高達(dá) 2048TOPS INT8 算力,創(chuàng)下全球 GPU 算力新紀(jì)錄。BR100 之所以能實(shí)現(xiàn)強(qiáng)大的性能,得益于 Chiplet 工藝的運(yùn)用。BR100 包含 2 顆計(jì)算芯粒,通過(guò)臺(tái)積電 CoWoS-S 工藝 die to die 互連,實(shí)現(xiàn)算力的跨越式提升。
但是,AI 芯片、GPGPU 芯片在設(shè)計(jì)難度、生態(tài)壁壘上較 CPU、GPU 更低,同時(shí)軟件棧的支持也是 AI 芯片能否大規(guī)模導(dǎo)入云服務(wù)商的主要矛盾,這導(dǎo)致了國(guó)內(nèi)云計(jì)算企業(yè)如阿里、百度等均嘗試自研 AI 芯片;這意味著國(guó)產(chǎn)芯片供應(yīng)鏈的機(jī)會(huì)(如接口芯片、IP 核等)比 AI 芯片的機(jī)會(huì)更具備確定性。
算力需求提升,導(dǎo)熱材料需求有望放量
最先進(jìn)的 NLP 模型中參數(shù)的數(shù)量呈指數(shù)級(jí)增長(zhǎng)。近年來(lái),自然語(yǔ)言處理(NLP)中 的基于 Transformer 的語(yǔ)言模型借助于大規(guī)模計(jì)算、海量數(shù)據(jù)以及先進(jìn)的算法和軟件取得 快速進(jìn)展。擁有大量參數(shù)、更多數(shù)據(jù)和更長(zhǎng)訓(xùn)練時(shí)間的語(yǔ)言模型可以獲得更加豐富、更加 細(xì)致的語(yǔ)言理解能力。因此,從 2018 年開始,NLP 模型參數(shù)以每年近乎一個(gè)數(shù)量級(jí)的速 度在增長(zhǎng)。
AI 大模型的持續(xù)推出帶動(dòng)算力需求放量。ChatGPT-3 模型版本擁有 1750 億個(gè)參數(shù), 而此前的 GPT-2 只有 1.5 億個(gè)參數(shù)。由于參數(shù)數(shù)量的增加,ChatGPT-3 的訓(xùn)練時(shí)間和算 力需求也大幅增加。為了訓(xùn)練 GPT-3 模型,OpenAI 需要使用超過(guò) 285,000 個(gè) CPU 核心 和 10,000 多個(gè) GPU。訓(xùn)練 ChatGPT-3 模型的總計(jì)算量大約相當(dāng)于在普通筆記本電腦上 運(yùn)行 175 億年的計(jì)算量,大約是 GPT-2 的數(shù)百倍(數(shù)據(jù)源自 OpenAI 官網(wǎng))。而且,在推 理過(guò)程中,ChatGPT 也需要大量的算力來(lái)生成連貫、準(zhǔn)確的文本。以中國(guó)近年算力規(guī)???, 2016-2021 年算力規(guī)模 CAGR 為 47%(數(shù)據(jù)源自中國(guó)信通院)。隨著 AI 大模型等對(duì)參數(shù) 需求大幅提升,全球?qū)τ谒懔Φ男枨箢A(yù)計(jì)將呈現(xiàn)爆發(fā)式的增加。
面對(duì)算力缺口,Chiplet 或成 AI 芯片“破局”之路。ChatGPT 等 AI 應(yīng)用蓬勃發(fā)展, 對(duì)上游 AI 芯片算力提出了更高的要求,頭部廠商通過(guò)不斷提升制程工藝和擴(kuò)大芯片面積推 出更高算力的芯片產(chǎn)品。然而在后摩爾時(shí)代,制程升級(jí)和芯片面積擴(kuò)大帶來(lái)的經(jīng)濟(jì)效益銳 減,架構(gòu)創(chuàng)新如 Chiplet 或?qū)⒊蔀樘嵘酒懔Φ闹匾緩?。Chiplet 技術(shù)除了成本和良率 端的優(yōu)勢(shì),還能夠在最大程度上提升芯片的算力以滿足不同應(yīng)用的需求。
Chiplet 技術(shù)是提升芯片集成度的全新方法。Chiplet 指的是將芯片的不同芯粒分開制 備后再通過(guò)互聯(lián)封裝形成一個(gè)完整芯片。Chiplet 較小的硅片面積不太容易產(chǎn)生制造缺陷, 因此可以避免大算力芯片良率太低的問(wèn)題。芯??梢圆捎貌煌に囘M(jìn)行分離制造,可以顯著降低成本。此外,Chiplet 技術(shù)帶來(lái)高速的 Die to Die 互連,使得芯片設(shè)計(jì)廠商得以將多 顆計(jì)算芯粒集成在一顆芯片中,以實(shí)現(xiàn)算力的大幅提升。
芯片算力提升對(duì)導(dǎo)熱材料的要求不斷提升。Chiplet 技術(shù)的核心思路在于盡可能多在物 理距離短的范圍內(nèi)堆疊大量芯片,以使得芯片間的信息傳輸速度足夠快。隨著更多芯片的 堆疊,不斷提高封裝密度已經(jīng)成為一種趨勢(shì)。隨著封裝密度的提高,單位電路的功率也不 斷増大以減小電路延遲,提高運(yùn)行速度;同時(shí),芯片和封裝模組的熱通量也不斷増大,顯 著提高導(dǎo)熱材料需求。
全球 Chiplet 市場(chǎng)增長(zhǎng)強(qiáng)勢(shì)。隨著下游人工智能(AI)、虛擬現(xiàn)實(shí)(MR)、物聯(lián)網(wǎng)(IoT) 的不斷發(fā)展,高算力的要求成為的未來(lái)趨勢(shì),Chiplet 技術(shù)或成為未來(lái)的主流芯片制造方案。 據(jù) Omida 測(cè)算,全球 Chiplet 市場(chǎng)規(guī)模將從 2018 年的 6.45 億美元逐步攀升至 2024 年的 24 億美元,CAGR 為 44.2%。近年,全球頭部導(dǎo)體公司都已經(jīng)開始布局 Chiplet,已經(jīng)有 商業(yè)化設(shè)備公布。
數(shù)據(jù)中心的算力需求與日俱增,導(dǎo)熱材料需求會(huì)提升。根據(jù)中國(guó)信通院發(fā)布的《中國(guó) 數(shù)據(jù)中心能耗現(xiàn)狀白皮書》,2021 年,散熱的能耗占數(shù)據(jù)中心總能耗的 43%,提高散熱能 力最為緊迫。隨著 AI 帶動(dòng)數(shù)據(jù)中心產(chǎn)業(yè)進(jìn)一步發(fā)展,數(shù)據(jù)中心單機(jī)柜功率將越來(lái)越大,疊 加數(shù)據(jù)中心機(jī)架數(shù)的增多,驅(qū)動(dòng)導(dǎo)熱材料需求有望快速增長(zhǎng)。
5G 通信基站相比于 4G 基站功耗更大,對(duì)于熱管理的要求更高。根據(jù)廣州 4G/5G 基 站功耗的實(shí)際測(cè)試結(jié)果,5G 基站的有源天線單元(Active Antenna Unit,AAU)或遠(yuǎn)端射 頻單元(Radio Remote Unit,RRU)的能耗相比于 4G 基站高出 3-5 倍,基帶處理單元(Base Band Unit,BUU)的功耗也比 4G 基站高出 30%-50%。綜合來(lái)看,5G 基站能耗大約為4G 基站的 3-4 倍。能耗的提升對(duì)導(dǎo)熱材料提出更高要求,因此 5G 基站中多采用高效導(dǎo)熱 的 TIM 材料以應(yīng)對(duì)高能耗帶來(lái)的高熱負(fù)載。
未來(lái) 5G 全球建設(shè)會(huì)為導(dǎo)熱材料帶來(lái)新增量。截止 2022 年 12 月,我國(guó)完成的 5G 基 站數(shù)超過(guò) 230 萬(wàn)個(gè),占全球基站的超過(guò) 60%。當(dāng)前我國(guó)的萬(wàn)人人均 5G 基站數(shù)已經(jīng)達(dá)到了 16.3 個(gè),遠(yuǎn)遠(yuǎn)大于全球平均水平。伴隨著未來(lái)全球的 5G 基站逐步建設(shè),對(duì)導(dǎo)熱材料的需 求預(yù)計(jì)將持續(xù)存在。
消費(fèi)電子在實(shí)現(xiàn)智能化的同時(shí)逐步向輕薄化、高性能和多功能方向發(fā)展。隨著集成電 路芯片和電子元器件體積不斷縮小,手機(jī)機(jī)身厚度越來(lái)越薄,但由于功能件數(shù)量增多,手 機(jī)功率密度和發(fā)熱量快速增加。此外,無(wú)線充電和快充技術(shù)的普及也加大了散熱的需求和 難度。簡(jiǎn)而言之,電子產(chǎn)品的性能越來(lái)越強(qiáng)大,而集成度和組裝密度不斷提高,導(dǎo)致其工 作功耗和發(fā)熱量的急劇增大,提高散熱需求。
新能源車產(chǎn)銷量不斷提升,帶動(dòng)導(dǎo)熱材料需求。2017-2022 年我國(guó)新能源汽車產(chǎn)銷量 迅速攀升。據(jù)中國(guó)汽車工業(yè)協(xié)會(huì)披露,2022 年國(guó)內(nèi)新能源汽車銷量為 688.7 萬(wàn)輛,同比 增加 96%,產(chǎn)量為 705.8 萬(wàn)輛,同比增加 99%。由于新能源車單車導(dǎo)熱材料的價(jià)值高于 傳統(tǒng)燃油車,新能源車滲透率的上升將帶動(dòng)導(dǎo)熱材料的需求上漲。
