SK海力士和三星之間要打價(jià)格戰(zhàn)?打下AI芯片成本是首件大事
據(jù)韓國(guó)媒體BusinessKorea近日?qǐng)?bào)道,在人工智能芯片對(duì)于高帶寬內(nèi)存HBM需求的推動(dòng)下,自2023年以來(lái),第三代的HBM3的報(bào)價(jià)已經(jīng)上漲超過(guò)5倍。這對(duì)于英偉達(dá)等AI芯片大廠來(lái)說(shuō),所需的關(guān)鍵HBM價(jià)格大漲,勢(shì)必會(huì)影響其AI芯片的成本。
在此背景下,市場(chǎng)傳聞稱,英偉達(dá)似乎故意煽動(dòng)三星電子、SK海力士彼此競(jìng)爭(zhēng),以便勢(shì)壓低HBM的價(jià)格。
4月25日,SK集團(tuán)董事長(zhǎng)崔泰源(Chey Tae-won)匆匆前往硅谷與英偉達(dá)CEO黃仁勛(Jensen Huang)會(huì)面,似乎跟這些策略有關(guān)。
雖然過(guò)去一個(gè)多月來(lái),英偉達(dá)一直在測(cè)試三星領(lǐng)先業(yè)界開(kāi)發(fā)出的12層堆疊的HBM3E,卻遲未下單采購(gòu)。市場(chǎng)解讀,這是一種策略,目標(biāo)是激勵(lì)三星與SK海力士進(jìn)行價(jià)格競(jìng)爭(zhēng)。
在最新的一季度財(cái)報(bào)會(huì)議上,三星表示,將繼續(xù)增加HBM供應(yīng),以滿足對(duì)生成人工智能不斷增長(zhǎng)的需求。本月,三星已經(jīng)開(kāi)始量產(chǎn)8層堆疊的HBM3E ,并計(jì)劃在第二季度量產(chǎn)12層堆疊的HBM3E產(chǎn)品。
SK海力士社長(zhǎng)郭魯正(Kwak Noh-Jung)也在一季度財(cái)報(bào)會(huì)議上表示,2025年的AI芯片組用的HBM幾乎全數(shù)售罄,2024年的供應(yīng)也已全部訂光。他說(shuō),12層堆疊的HBM3E將在今年5月送樣,預(yù)計(jì)第三季開(kāi)始量產(chǎn)。SK海力士正在與一些客戶就HBM的長(zhǎng)期合同進(jìn)行談判。
AI芯片制造成本也在不斷上升
近年來(lái),隨著人工智能技術(shù)的快速發(fā)展,對(duì)HBM內(nèi)存芯片的需求不斷攀升。HBM作為高性能計(jì)算領(lǐng)域不可或缺的關(guān)鍵部件,其價(jià)格在過(guò)去一年內(nèi)已經(jīng)上漲了5倍以上。
這一漲價(jià)趨勢(shì)的根源,主要在于HBM芯片的供給不足難以滿足日益增長(zhǎng)的市場(chǎng)需求。目前,全球HBM芯片市場(chǎng)被三星和SK海力士?jī)杉翼n企所壟斷,他們掌握著超過(guò)90%的市場(chǎng)份額。
在產(chǎn)能有限的情況下,兩家韓企不得不順應(yīng)市場(chǎng)行情,不斷提高HBM芯片的售價(jià)。這就給下游需求方,尤其是英偉達(dá)等關(guān)鍵客戶,帶來(lái)了極大的成本壓力。
金融服務(wù)公司 Raymond James 分析師曾預(yù)估過(guò) B200 的成本。
英偉達(dá)每制造一顆 H100 的成本約為 3320 美元,售價(jià)為 2.5-3 萬(wàn)美元之間,根據(jù)兩者的性能差異推算 B200 成本將比 H100 高出 50%~60%,大概是 6000 美元。
黃仁勛在發(fā)布會(huì)后接受 CNBC 專訪時(shí)透露,Blackwell GPU 的售價(jià)約為 3 萬(wàn)~ 4 萬(wàn)美元,整個(gè)新架構(gòu)的研發(fā)大約花了 100 億美元。
我們必須發(fā)明一些新技術(shù)才能使其(新架構(gòu))成為可能。
按照以往的節(jié)奏,英偉達(dá)大約每?jī)赡昃蜁?huì)發(fā)布新一代 AI 芯片,最新的 Blackwell 相較于前幾代產(chǎn)品在算力性能和能耗控制上有了顯著的提升,更直觀的是, 結(jié)合了兩顆 GPU 的 Blackwell 比 Hooper 大了將近一倍。
高昂的成本不僅與芯片有關(guān),還與設(shè)計(jì)數(shù)據(jù)中心和集成到其他公司的數(shù)據(jù)中心緊密相連,因?yàn)樵邳S仁勛看來(lái),英偉達(dá)并不制造芯片,而是在建數(shù)據(jù)中心。
根據(jù)英偉達(dá)最新的財(cái)報(bào)顯示,第四財(cái)季營(yíng)收達(dá)到創(chuàng)紀(jì)錄的 221 億美元,同比增長(zhǎng) 265%。四季度凈利潤(rùn) 123 億美元,同比暴增 765%。這當(dāng)中最大的營(yíng)收來(lái)源數(shù)據(jù)中心部門,達(dá)到創(chuàng)紀(jì)錄的 184 億美元,較第三季度增長(zhǎng) 27%,較上年同期增長(zhǎng) 409%。
研發(fā)成本很高,但以此搏來(lái)的正向回報(bào)更高。
英偉達(dá)目前正在構(gòu)建的數(shù)據(jù)中心,包含全棧系統(tǒng)和所有軟件,是一套完整的體系,Blackwell 或者說(shuō) GPU,只是這當(dāng)中的一環(huán)。
數(shù)據(jù)中心被分解成多個(gè)模塊,用戶能夠根據(jù)自身需求自由選擇相應(yīng)的軟硬件服務(wù),英偉達(dá)會(huì)根據(jù)不同的要求對(duì)網(wǎng)絡(luò)、存儲(chǔ)、控制平臺(tái)、安全性、管理進(jìn)行調(diào)整,并有專門團(tuán)隊(duì)來(lái)提供技術(shù)支持。
如此的全局視野和定制化服務(wù)到底好不好,數(shù)據(jù)可以說(shuō)明一切:截至 3 月 5 日,英偉達(dá)的市值繼超越 Alphabet、亞馬遜等巨頭后,又超過(guò)沙特阿美,成為全球第三大公司,僅次于微軟和蘋果兩大科技巨頭,總市值達(dá)到 2.4 萬(wàn)億美元。
目前,全球數(shù)據(jù)中心大約有 2000 億歐元(約合人民幣 7873 億)的市場(chǎng),英偉達(dá)正是這當(dāng)中的一部分,黃仁勛預(yù)測(cè)這個(gè)市場(chǎng)在未來(lái)極有可能增長(zhǎng)到 1-2 萬(wàn)億美元。
英偉達(dá)的"價(jià)格戰(zhàn)"策略
面對(duì)HBM芯片價(jià)格的飆升,英偉達(dá)顯然很難接受。作為全球最大的GPU芯片供應(yīng)商,英偉達(dá)需要大量使用HBM內(nèi)存來(lái)支撐其高性能計(jì)算產(chǎn)品。如果HBM芯片價(jià)格持續(xù)大漲,必將嚴(yán)重影響其產(chǎn)品的成本競(jìng)爭(zhēng)力。
因此,英偉達(dá)開(kāi)始采取了一些"價(jià)格戰(zhàn)"策略。一方面,他們一直在密切關(guān)注并測(cè)試三星的最新HBM3E芯片;另一方面,又主動(dòng)去接觸SK海力士的高管,似乎想要通過(guò)"挑撥離間"的方式,引發(fā)韓企之間的內(nèi)部競(jìng)爭(zhēng)。
這種做法,無(wú)疑是想要利用三星和SK海力士之間的矛盾,讓他們?cè)趦r(jià)格上展開(kāi)惡性競(jìng)爭(zhēng),從而達(dá)到降低HBM芯片采購(gòu)成本的目的。
降模型成本
2024年非常關(guān)鍵的事
今年以來(lái),算力已經(jīng)被公認(rèn)為是大模型競(jìng)爭(zhēng)的「軍火庫(kù)」。這不僅讓英偉達(dá)的市值超過(guò)英特爾,也讓其財(cái)報(bào)中的GPU收入超過(guò)了手機(jī)芯片之王高通。
但算力的另一面是GPU供應(yīng)緊張、價(jià)格昂貴。成本壓力是會(huì)層層傳導(dǎo)的。
比如AWS首席執(zhí)行官Adam Selipsky前不久在談到整個(gè)行業(yè)時(shí)曾直言:「我接觸過(guò)的很多客戶都對(duì)運(yùn)行其中一些模型的成本感到不滿?!?/span>
在這個(gè)問(wèn)題上,中美企業(yè)所面臨的挑戰(zhàn)并無(wú)不同。在同《降噪NoNoise》交流時(shí),侯震宇提到他的一個(gè)判斷——預(yù)計(jì)2024年整體算力資源供應(yīng)的不確定性或者說(shuō)緊張程度仍然比較大,所以云計(jì)算廠商面臨的共性問(wèn)題是如何更高效地使用算力資源。
其實(shí)不僅是算力資源昂貴,目前人力資源、數(shù)據(jù)資源(如數(shù)據(jù)標(biāo)注),本身成本也很高。「確保大家用足夠少的錢能訓(xùn)練出來(lái)想要的模型,以及用一個(gè)客戶可接受的成本使其真的把AI大模型用起來(lái),這些會(huì)是2024年非常關(guān)鍵的事?!?/span>
目前,國(guó)內(nèi)云計(jì)算廠商的思路大多是在保證同等效果前提下,通過(guò)推理優(yōu)化、模型訓(xùn)練工具鏈優(yōu)化等,以縮短算力使用時(shí)間。
以百度智能云為例,其主要通過(guò)基礎(chǔ)設(shè)施層的異構(gòu)計(jì)算平臺(tái)「百舸」、大模型平臺(tái)層的「千帆」互相打配合,以實(shí)現(xiàn)算力性價(jià)比。
追求算力性價(jià)比的方向無(wú)非兩個(gè):一是提高GPU利用率,縮短使用時(shí)間。比如在大模型訓(xùn)練環(huán)節(jié),百度通過(guò)分布式并行訓(xùn)練策略和微秒級(jí)互聯(lián),讓萬(wàn)卡規(guī)模集群訓(xùn)練的加速比達(dá)到95%、萬(wàn)卡集群有效訓(xùn)練時(shí)間占比達(dá)到98%。
「百舸」升級(jí)到3.0版本后,訓(xùn)練和推理場(chǎng)景的吞吐量據(jù)稱可提高30%-60%,這些意味著原來(lái)要用100天的訓(xùn)練,現(xiàn)在可能只用70天,節(jié)約時(shí)間等于間接省錢。
二是適配成本更低的AI芯片,除英偉達(dá)外,千帆平臺(tái)還兼容昆侖芯、昇騰、海光DCU、英特爾等國(guó)內(nèi)外主流AI芯片。畢竟不是所有訓(xùn)練都需要?jiǎng)佑肏800這種頂格待遇。
通過(guò)組合選項(xiàng),理論上客戶可以用最小的切換成本完成算力適配。這種屬于直接省錢。
不過(guò)再怎么省錢,前提還是要保證AI模型的效果。若達(dá)不到客戶的預(yù)期效果,云服務(wù)商對(duì)算力資源「算計(jì)」再多,也是沒(méi)有意義的。
