日日躁夜夜躁狠狠躁超碰97,无码国内精品久久综合88 ,热re99久久精品国99热,国产萌白酱喷水视频在线播放

歡迎訪問深圳市中小企業(yè)公共服務平臺電子信息窗口

生成式AI與存儲技術協(xié)同演進:從架構創(chuàng)新到產業(yè)落地

2025-04-11 來源:國際電子商情
852

關鍵詞: 存儲技術 生成式AI 協(xié)同演進 技術創(chuàng)新 可持續(xù)發(fā)展

大數據時代,存儲與生成式AI的協(xié)同演進成為推動技術發(fā)展的重要趨勢。2022年11月,ChatGPT的橫空出世加速了生成式AI的商用落地。但誰都不曾想到,第二波引爆AI大模型的,竟是中國AI創(chuàng)企DeepSeek。2025年初,DeepSeek-R1意外走紅,該模型實施“錯峰降價”和“開源策略”,此舉大幅降低了企業(yè)部署AI的門檻。

AI的基石是數據基礎設施,存儲是存力基礎設施的核心組成部分,利用高效數據存儲與管理,支撐模型訓練、推理優(yōu)化及多模態(tài)應用落地。從ChatGPT的存儲密集型挑戰(zhàn),到DeepSeek-R1的存儲優(yōu)化突破,生成式AI正通過架構創(chuàng)新與開源生態(tài),推動存儲資源的高效利用與規(guī)?;渴稹?/p>

AI降本增效驅動存儲協(xié)同創(chuàng)新

DeepSeek CEO在今年2月公開表示,DeepSeek-R1基于動態(tài)稀疏訓練和混合專家架構(MoE),通過減少冗余參數存儲和優(yōu)化計算路徑,在緩存命中場景下實現(xiàn)理論成本的下限為0.14美元/百萬輸入tokens,實際成本可能因任務復雜度波動。而GPT-4 Turbo、Claude 3、LLaMA3等其他模型在緩存命中場景下的輸入成本大致在0.56美元/百萬tokens至9.8美元/百萬tokens不等。

隨著大模型成本大幅度降低,AI技術向中小企業(yè)的滲透也得以加速。DeepSeek-R1在Hugging Face發(fā)布一個月左右,其累計下載量就突破了1,000萬次。IDC中國研究經理程蔭對外表示,DeepSeek引領基礎大模型開啟另一開發(fā)新范式——以一系列創(chuàng)新優(yōu)化技術與手段降低成本和復雜性,從而降低門檻。

一方面,AI企業(yè)希望能通過算力資源優(yōu)化及模型輕量化技術,系統(tǒng)性降低AI開發(fā)與部署成本;另一方面,隨著邊緣AI加速落地,邊緣設備激增也導致分布式數據存儲的需求上升。市場研究機構Omdia指出,AI技術的快速發(fā)展正在推動存儲設備市場的增長。預計到2029年,全球存儲設備出貨量將以12.5%的復合年增長率(CAGR)持續(xù)增長,主要得益于AI代理部署和私人數據增強訓練帶來的數據中心存儲需求激增。

而存儲系統(tǒng)也正通過高密度存儲方案和低延時數據管理,為生成式AI提供高效訓練、推理優(yōu)化及多模態(tài)應用落地的“存力底座”,驅動模型性能與成本效率的平衡。與此同時,生成式AI的加速商用,也在驅動存儲廠商加速推進高密度存儲架構升級與毫秒級低延時硬件創(chuàng)新。

如今,存儲廠商正通過介質創(chuàng)新、架構重構和算法優(yōu)化等手段,系統(tǒng)性突破高密度與低延時的技術瓶頸,為百億級參數模型的規(guī)?;逃锰峁┑讓又?。

在介質創(chuàng)新方面,存儲廠商通過熱輔助磁記錄(HAMR)技術、QLC SSD與高帶寬存儲器(HBM)來實現(xiàn)。

  • HAMR通過激光瞬時加熱盤片局部區(qū)域,降低磁介質矯頑力,實現(xiàn)納米級磁顆粒的穩(wěn)定排列。比如,希捷HAMR硬盤當前商用產品單碟容量為3至3.2TB,實驗室目標為5TB及以上,是AI數據中心冷數據存儲的性價比方案。

  • QLC通過4bit/cell單元結合3D堆疊工藝,理論上其單位面積容量較TLC提升三成左右。目前,三星、鎧俠、美光、閃迪等存儲巨頭均針對QLC SSD有布局。

  • HBM通過硅通孔(TSV)技術堆疊DRAM芯片,結合2.5D先進封裝,以低頻率實現(xiàn)高通道寬度,兼具高帶寬、高容量與低功耗特性,如今已廣泛應用于數據中心、AI訓練等高算力場景。自2016年推出以來,HBM歷經了多次迭代,現(xiàn)在的HBM3E將傳輸速度提升至8Gbps,容量擴展至24GB(通過12層堆疊實現(xiàn))。

在架構重構方面,分布式擴展與存算一體架構已成為重要路徑。分布式網絡存儲系統(tǒng)采用可擴展的系統(tǒng)結構,利用多臺存儲服務器分擔存儲負荷,利用位置服務器定位存儲信息,它不但提高了系統(tǒng)的可靠性、可用性和存取效率,還易于擴展;存算一體架構是指將傳統(tǒng)以計算為中心的架構轉變?yōu)橐詳祿橹行牡募軜嫞苯永么鎯ζ鬟M行數據處理,從而把數據存儲與計算融合在同一芯片中,極大提高計算并行度與能量效率,特別適用于以可穿戴設備、移動設備、智能家居等場景為主的深度學習神經網絡領域。

在算法層面,存儲廠商可以通過數據編織(Data Fabric)和近數據處理(NDP)來優(yōu)化性能。數據編織旨在通過邏輯層面的數據整合與加工,打破物理集中的局限,實現(xiàn)數據的無縫共享與高效利用。近數據處理技術是指利用存儲控制器的計算能力,執(zhí)行與數據存取緊密相關的任務,在減少數據遷移的同時,具有低延遲、高可擴展性和低功耗等優(yōu)點。

通過采用這些技術,企業(yè)可以提升數據處理和分析的效率,達到節(jié)約系統(tǒng)資源,降低時延和能耗的目的。具體案例包括,華為通過數據編織技術,可實現(xiàn)全局元數據智能調度,保障百億參數模型訓練連續(xù)性;Nvidia GPUDirect存儲技術結合RDMA與NVMe-oF協(xié)議,支持數據直傳GPU顯存,減少推理延遲。

由此可見,AI技術的降本增效與存儲需求的指數級增長形成雙向驅動,倒逼存儲技術創(chuàng)新成為全行業(yè)智能化升級的底層剛需。

從數據倉庫升級至智能數據管理平臺

在存儲技術與生成式AI協(xié)同演進的過程中,存儲系統(tǒng)正從被動數據倉庫向智能數據管理平臺演進,通過軟件定義存儲、分布式架構優(yōu)化和實時分析能力,成為支撐AI計算的高效數據調度中心。如今,存儲系統(tǒng)通過AI賦能的動態(tài)優(yōu)化機制,實現(xiàn)了資源與計算需求的協(xié)同。

單個千億參數的大語言模型在訓練過程中,需要PB級的數據存儲與處理能力。在模型迭代過程中產生的增量數據,也需要高性能閃存來提供實時讀寫保障。同時,文本生成、圖像渲染、視頻合成等場景的并發(fā)處理,也對存儲系統(tǒng)提出了更高的要求。目前,企業(yè)級SSD為了滿足高IOPS(每秒輸入輸出操作次數)和低延遲的特性,正朝著30TB+的大容量方向發(fā)展。

此外,AI服務器架構升級也在催生新型存儲方案。比如,存算一體架構打破傳統(tǒng)“計算-存儲”分離模式,通過硬件級協(xié)同加速AI推理效率,使存儲介質直接參與計算任務的預處理與中間結果緩存。又如,智能分層存儲讓熱數據采用3D NAND閃存實現(xiàn)毫秒級響應,而冷數據依托QLC技術提升單盤容量、降低綜合存儲成本。

再者,多元化市場需求也在驅動存儲技術創(chuàng)新向兩個方向突破——基礎物理層能效優(yōu)化與場景化定制能力強化。能效優(yōu)化技術包括通過3D TLC閃存電荷捕獲層梯度摻雜設計提升數據穩(wěn)定性,結合動態(tài)功耗管理技術,邊緣設備在非連續(xù)讀寫模式下綜合功耗可降至1.5W/TB;在場景化定制能力方面,包括車規(guī)級存儲基于AEC-Q100標準實現(xiàn)寬溫耐受(-40℃至125℃),并通過LPDDR5接口與多芯片冗余架構支持高并發(fā)數據處理。

因此,可以說存儲系統(tǒng)正升級為AI基礎設施的核心支撐組件,實現(xiàn)動態(tài)數據治理、存算協(xié)同加速、AI增強優(yōu)化的三大能力躍遷——通過數據編織與智能分層技術,支撐多模態(tài)數據的實時調度與價值挖掘;基于訓推一體化架構與近存儲計算,縮短AI任務端到端處理時延;利用模型訓練特征反饋驅動存儲資源動態(tài)分配,實現(xiàn)性能、成本與能耗的平衡。

存儲巨頭的產品矩陣與全場景覆蓋

面對越來越多的存儲需求,行業(yè)領軍企業(yè)當然不會錯過這難得的商機。這些企業(yè)通過技術分化與全場景產品覆蓋(云端高算力、邊緣低成本、端側輕量化),去構建適配AI時代需求的完整解決方案。我們也看到,存儲廠商正通過構建更全面的產品矩陣,覆蓋從云端訓練到邊緣推理的全場景需求。預計該組合方案將提升服務器的單位存儲密度,優(yōu)化綜合能效比。

“市場對存儲器提出了大容量化、高性能化、低功耗化的要求,顧客對存儲器的需求也呈現(xiàn)多元化,為此我們將推出最優(yōu)化組合的產品。”鎧俠電子(中國)有限公司技術執(zhí)行官戶谷得之對《國際電子商情》表示,在用于大規(guī)模語言模型開發(fā)、學習、推論的AI服務器方面,市場對閃存、SSD的需求有望迅猛增長。

鎧俠為應對AI驅動的存儲性能需求,正在加速CBA技術(CMOS直接鍵合存儲陣列)在第十代3D NAND閃存中的應用。其第十代3D NAND通過CBA技術獨立優(yōu)化CMOS與存儲陣列晶圓,結合Toggle DDR6.0接口與SCA協(xié)議,NAND I/O接接口速度提升33%至4.8Gb/s,其通過優(yōu)化電路設計降低動態(tài)功耗,并基于高密度3D堆疊技術(如332層)推出適配數據中心的QLC架構存儲方案。

三星、SK海力士、美光也同屬存儲產業(yè)鏈上游核心供應商,它們在市場定位上與鎧俠的業(yè)務側重與技術路徑存在差異。三星通過垂直封裝技術優(yōu)化高帶寬計算市場,并持續(xù)引領消費級DRAM技術發(fā)展;SK海力士正聚焦HBM3E堆疊技術,支撐AI服務器近存計算需求,并探索汽車與移動端HBM應用;美光基于HBM3E與低功耗DRAM強化邊緣計算與車載存儲場景的成本優(yōu)勢。

存儲巨頭的差異化技術布局本質上是面向AI驅動的數據基礎設施變革所作出的戰(zhàn)略響應。在云端,通過存算一體架構與先進封裝技術提升存儲密度,支撐大模型訓練需求;在邊緣,基于低功耗DRAM與動態(tài)功耗管理技術適配分布式推理場景;在端側,通過移動HBM,如三星的LPW DRAM,與高能效接口協(xié)議提升終端響應效率,兼顧功耗與性能。這種技術分化推動存儲架構從單一性能指標轉向多場景協(xié)同,形成覆蓋“云邊端”的互補生態(tài),為AI算力與存儲密度的協(xié)同優(yōu)化奠定硬件基礎。

不過,在數據中心和AI領域,存儲技術通過PCIe 5.0接口與存算協(xié)同架構(如HBM3E與GPU的高效連接)來優(yōu)化性能,QLC技術尚未成為核心支撐——在移動終端,存儲密度提升依賴TLC技術,QLC的應用仍受限。所幸的是,目前已經有許多存儲廠商在推動QLC技術的商用。

在協(xié)議與接口方面,消費級市場處于高端領域滲透階段,但PCIe 5.0受限于成本與散熱,還待進一步普及滲透。如今,存儲業(yè)內人士普遍認為,2025年PCIe 5.0技術從底層硬件到應用生態(tài)已經成熟,預計在今年內我們有望看到更多PCIe 5.0 SSD商用,其覆蓋場景從消費級擴展到企業(yè)級。

具體來看,PCIe 5.0固態(tài)硬盤雖自2022年逐步上市,但其早期受限于存儲主控工藝落后、高功耗與散熱難題,導致消費級產品長期處于“殘血”狀態(tài)。盡管2025年新一代存儲主控通過工藝優(yōu)化和散熱設計改進,使性能逐步接近理論值,但成本高昂與終端用戶需求不足仍制約普及率。因此,行業(yè)預測消費級市場需待主控成本下降、散熱方案成熟才能全面鋪開。

存儲行業(yè)面臨ESG轉型

除了存儲技術層面的創(chuàng)新與升級之外,我們也看到,AI的進一步滲透也帶來了更多的電能的消耗。目前,AI的電能消耗已從單一模型訓練擴展至全生命周期,涵蓋推理、部署和持續(xù)優(yōu)化環(huán)節(jié)。隨著算力需求指數級增長,能源效率優(yōu)化與清潔能源整合將成為平衡技術進步與可持續(xù)發(fā)展的關鍵。

早在2022年,數據中心用電量已占全球電力消耗的1%-1.5%,國際能源署(IEA)預測到2026年這一比例可能翻倍至2%。AI算力需求激增或使2030年突破3%。另外,生成式AI的爆發(fā)式增長,意外成為存儲技術迭代的“壓力測試器”。目前,大模型訓練單次耗電超小型核電站單日發(fā)電量,其中存儲系統(tǒng)能耗占比10%至15%(參考谷歌透露的其用于AI訓練的能量消耗占總用電量數據。)

在全球數據中心能耗激增與歐盟碳關稅政策的雙重壓力下,存儲行業(yè)正掀起一場靜默卻深刻的變革。頭部存儲企業(yè)不再滿足于單純的技術參數競爭,而是將綠色生產、能效優(yōu)化與AI算力需求深度融合,試圖在商業(yè)價值與社會責任之間找到平衡點。而這場變革的起點,是存儲密度的躍升與能耗的“精準瘦身”。比如,美光方面宣稱,其1β工藝HBM3E比競品的功耗降低30%,適配高算力GPU。

此外,綠色生產體系的構建,讓半導體封測廠從耗能大戶轉型為低碳標桿。以美光在西安的封測廠為例,為了實現(xiàn)更高的環(huán)境目標,美光制定了四個2025年的量化指標,包括碳排放的顯著減排、可再生能源的全面使用、水資源的有效保護,以及廢棄物的資源化和零填埋。同時,美光還積極部署了多項可持續(xù)發(fā)展項目,在其西安工廠引入自動化技術、配備先進制程控制系統(tǒng)等,這些舉措不僅提高了生產效率,還顯著減少了碳排放。

據戶谷得之介紹,鎧俠以3D閃存的大容量化、高性能化為目標,正在推進AI、數字社會不可或缺的新概念半導體存儲器的研發(fā),以滿足未來在計算機、存儲系統(tǒng)領域對半導體的需求?!盀榇?,我們將推進新結構的高速存儲器、SCM的研發(fā)工作,并推進半導體產品的節(jié)能化?!辨z俠開發(fā)的低功耗SCM內存,通過減少數據“折返跑”提升推理環(huán)節(jié)的能效。

歐盟碳關稅也在加速“存儲即服務”模式向高密度、高能效升級,即使該模式技術基礎已存在多年??偟膩砜?,這是一種由公司向個人或企業(yè)提供技術專業(yè)知識和存儲空間的商業(yè)模式。當存儲從固定資產變?yōu)榘葱栀徺I的服務,整個產業(yè)的商業(yè)邏輯正在被重寫。

在這場靜悄悄的革命中,存儲設備正從“數據倉庫”進化為“減碳引擎”。技術的每一次突破,都在為地球的碳賬戶存入一筆綠色資產?;蛟S未來某天,人們選購存儲產品時,能效標簽的重要性將超越容量參數,就像現(xiàn)在家電市場的能效等級一樣成為消費共識。這將不僅是技術的勝利,更是人類對可持續(xù)發(fā)展的一次集體投票。

中國引領存儲與生成式AI協(xié)同創(chuàng)新

值得注意的是,在數字化浪潮席卷全球的當下,中國正以前瞻性布局和系統(tǒng)性規(guī)劃,引領存儲技術與生成式AI的協(xié)同創(chuàng)新邁向新高度。

在國家層面,工信部為存儲技術與生成式AI的協(xié)同發(fā)展提供了頂層設計框架——“算力強基揭榜行動”從國家戰(zhàn)略層面明確存儲系統(tǒng)作為“動態(tài)決策單元”的定位,要求通過多介質存儲管理與跨域資源協(xié)同技術實現(xiàn)算力與存儲效能的全鏈路閉環(huán)優(yōu)化。

此外,由存儲產業(yè)技術創(chuàng)新戰(zhàn)略聯(lián)盟和中國電子技術標準化研究院等20多家學研機構聯(lián)合發(fā)布的《2025年AIGC數據存儲技術研究報告》系統(tǒng)性論證了存儲系統(tǒng)從靜態(tài)數據承載向“數據處理-訓練-推理-歸檔”全鏈路閉環(huán)的轉型路徑,并通過高??蒲衅脚_等案例驗證技術落地效果,支撐AI訓練推理全流程效能躍升。

這些舉措為存儲技術與生成式AI的協(xié)同發(fā)展注入了強大動力,標志著中國在這一領域邁出了堅實步伐。未來,隨著這些頂層設計的逐步落地和企業(yè)實踐的深入推進,中國有望在存儲技術與生成式AI的融合創(chuàng)新中取得更多突破,為全球科技發(fā)展貢獻更多中國智慧和力量。