這波AI潮真正賺錢的只有這三家企業(yè),AI企業(yè)要吃紅利還得再等等
今年以來,人工智能(AI)成為香餑餑,世界各大IT巨頭競(jìng)相采購服務(wù)器并訓(xùn)練大模型。
結(jié)合業(yè)界人士以及各大AI頭部企業(yè)最新消息顯示,盡管科技公司都投入大量資源發(fā)展最新AI技術(shù),但是多家頭部企業(yè)表示這一業(yè)務(wù)目前難以產(chǎn)生足夠的利潤。
成本巨大、獲利較難
據(jù)微軟、AMD等龍頭企業(yè)表示,AI業(yè)務(wù)難以獲利的最重要原因,還在于AI研發(fā)相關(guān)工具成本過于高昂,比如生成式AI大模型的耗費(fèi)就是典型的燒錢。
據(jù)華爾街日?qǐng)?bào)爆料,微軟的AI編程工具GitHub Copilot用戶量高達(dá)150萬,但是平均每個(gè)月在每個(gè)用戶身上都要倒貼20美元,最高能達(dá)80美元。不止微軟“表面光鮮”,谷歌、亞馬遜、Adobe、Zoom等巨頭也面臨同樣的窘境。據(jù)SemiAnalysis的專家Dylan Patel統(tǒng)計(jì),OpenAI光是運(yùn)行ChatGPT,每日投入的成本就可能高達(dá)70萬美元。
據(jù)悉,生成式人工智能工具的商業(yè)模式未經(jīng)充分驗(yàn)證,其運(yùn)行成本高昂,需要配備昂貴芯片的大型服務(wù)器,且耗電巨大。并且當(dāng)下AI相關(guān)應(yīng)用的落地場(chǎng)景、應(yīng)用價(jià)值也仍待挖掘。目前,微軟、谷歌、Adobe等其它科技公司正在嘗試各種方法來推銷付費(fèi)人工智能服務(wù)。
谷歌的人工智能助手服務(wù)每月訂閱費(fèi)6美元,此后也計(jì)劃額外收取每月30元的費(fèi)用;網(wǎng)絡(luò)視頻公司Zoom也嘗試內(nèi)部開發(fā)更簡(jiǎn)便的AI來降低成本;Adobe則采取每月限量使用的機(jī)制,來確保其人工智能服務(wù)Firefly不會(huì)陷入虧損,用戶每月有固定的分配額度,一旦超過,其運(yùn)行速度會(huì)大幅降低;OpenAI的ChatGPT 4.0每月訂閱費(fèi)用為20美元,但是舊版本可免費(fèi)使用。
上文所述的微軟和GitHub還沒有回應(yīng)該服務(wù)是否盈利,但該企業(yè)計(jì)劃后續(xù)升級(jí)會(huì)提高使用價(jià)格,除了Microsoft 365企業(yè)基本月費(fèi)13美元之外,人工智能強(qiáng)化版本每月會(huì)額外收取30美元。
亞馬遜云部門主管Adam Selipsky表示,他接觸的許多客戶都對(duì)運(yùn)行一些大模型的成本感到不滿。微軟企業(yè)戰(zhàn)略主管Chris Young認(rèn)為,企業(yè)和消費(fèi)者需要時(shí)間來了解他們希望如何使用人工智能,以及愿意為此支付多少費(fèi)用。他表示,“很明顯,我們現(xiàn)在必須把對(duì)AI的興趣和興奮轉(zhuǎn)化為真正的行動(dòng)?!?/span>
生成式人工智能公司W(wǎng)riter的首席執(zhí)行官M(fèi)ay Habib表示,AI公司估值的上升反映了人們對(duì)其前景的看好,但是公司高管們很快就會(huì)更加關(guān)注成本問題。她認(rèn)為,2024年將是人工智能投資熱度降溫的一年。
英偉達(dá)贏麻了
當(dāng)ChatGPT橫空出世,英偉達(dá)“命運(yùn)的齒輪”就已經(jīng)悄悄轉(zhuǎn)動(dòng)。
黃仁勛道,AI的iphone時(shí)刻已經(jīng)到來。如今,“一個(gè)新的計(jì)算時(shí)代已經(jīng)開始,全球公司正在從通用型向加速計(jì)算和生成型人工智能過渡”,英偉達(dá)也在AI芯片上收獲了比預(yù)想更好的利潤。
英偉達(dá)公布的2024第二財(cái)報(bào)季業(yè)績(jī)顯示,截至2023年7月30日,公司第二季度收入135.07億美元,同比增長101%,比上一季度增長88%,高于分析師預(yù)期110.4億美元;歸屬凈利潤實(shí)現(xiàn)61.88億美元,同比增長8.43倍;攤薄每股收益為2.48美元,同比上年同期增長854%,環(huán)比上一季度增長202%。
各項(xiàng)指標(biāo)超過預(yù)期,這或許也是英偉達(dá)史上最佳的業(yè)績(jī)報(bào)告。AI熱潮推動(dòng)的大模型訓(xùn)練的GPU市場(chǎng)需求還處在高位,英偉達(dá)作為市面上唯一的高端GPU的供應(yīng)商,H100系列芯片在市場(chǎng)中一卡難求。因此,英偉達(dá)在財(cái)報(bào)中不僅披露了新產(chǎn)品進(jìn)展,也在加快產(chǎn)能建設(shè)。
自英偉達(dá)發(fā)布大模型專用GPU并量產(chǎn)供貨后,由于市場(chǎng)需求遠(yuǎn)大于產(chǎn)能供應(yīng),市面上的英偉達(dá)H100芯片被瘋狂加價(jià),有時(shí)候甚至一卡難求。
據(jù)市場(chǎng)消息稱,英偉達(dá)AI芯片H100在2023年8月的市場(chǎng)總需求可能在43.2萬張左右,而據(jù)據(jù)eBay網(wǎng)站顯示,目前一張專門用于訓(xùn)練AI大模型的H100芯片在Ebay上的價(jià)格甚至炒到了4.5萬美元,折合人民幣超過了30萬元。
SK海力士低調(diào)吸金
去年9月推出的H100,是英偉達(dá)產(chǎn)品矩陣中最先進(jìn)的GPU。
相較于前任A100,它的價(jià)格翻了1.5-2倍左右,但性能卻有了質(zhì)的飛躍:推理速度提升3.5倍,在訓(xùn)練速度提升2.3倍;如果用伺服器叢集運(yùn)算的方式,訓(xùn)練速度更是能提高到9倍。在LLM訓(xùn)練中,它能讓原本一個(gè)星期的工作量,縮短為20個(gè)小時(shí)。
一塊英偉達(dá)H100,主要由三個(gè)部分構(gòu)成:中心的H100裸片兩側(cè)各有三個(gè)HBM堆棧,最外層則是臺(tái)積電的2.5D CoWoS封裝框。
三個(gè)部件里,核心的邏輯芯片供應(yīng)是最簡(jiǎn)單的,它主要產(chǎn)自臺(tái)積電臺(tái)南18號(hào)工廠,使用4N工藝節(jié)點(diǎn)(實(shí)際是5nm+)。由于5nm+下游的PC、智能手機(jī)和非AI相關(guān)數(shù)據(jù)中心芯片市場(chǎng)疲軟,目前臺(tái)積電5nm+產(chǎn)能利用率不到70%。因此邏輯芯片供應(yīng)沒有問題。
英偉達(dá)最主要的供應(yīng)缺口,來自邏輯芯片兩側(cè)的6塊HBM(High Bandwidth Memory,高帶寬內(nèi)存),和把邏輯芯片、HBM連接起來的CoWoS封裝(Chip on wafer on Substrate,芯片、晶圓、基板封裝)。
HBM是一種基于3D堆疊工藝的DRAM內(nèi)存芯片。其技術(shù)原理,就是將多個(gè)DDR芯片,垂直堆疊在一起,通過硅通孔(TSV)和微凸塊(μBmps)技術(shù),把芯片相互連接,從而突破了現(xiàn)有的性能限制,大大提高了存儲(chǔ)容量,實(shí)現(xiàn)更高帶寬、更高位寬、更低功耗、更小尺寸的DDR組合陣列。
內(nèi)存芯片對(duì)GPU性能至關(guān)重要,尤其是訓(xùn)練AI所用的高性能GPU。推理和訓(xùn)練工作負(fù)載是內(nèi)存密集型任務(wù)。隨著AI模型中參數(shù)數(shù)量的指數(shù)級(jí)增長,僅權(quán)重一項(xiàng)就將模型大小推高到了TB級(jí)。因此,從內(nèi)存中存儲(chǔ)和檢索訓(xùn)練和推理數(shù)據(jù)的能力決定了GPU性能的上限。AI大模型和應(yīng)用越多,越有利于HBM制造商。
從整體HBM市場(chǎng)來看,兩大韓國存儲(chǔ)巨頭SK海力士及三星占絕對(duì)壟斷地位,二者合計(jì)市占率在90%左右。
英偉達(dá)H100上面使用的HBM3由SK海力士獨(dú)家供應(yīng),這是目前最先進(jìn)的HBM產(chǎn)品。
HBM3工藝復(fù)雜、成本高昂、產(chǎn)能有限,2022年,在整個(gè)HBM市場(chǎng)中,HBM3僅占約8%的市場(chǎng)份額。作為全球唯一有能力量產(chǎn)HBM3的公司,SK海力士牢牢卡住了英偉達(dá)H100的脖子;而前代GPU A100/A800以及AMD的MI200使用的則是落后一代的HBM2E技術(shù)。
不過,當(dāng)前存儲(chǔ)芯片業(yè)界正處于HBM2E向HBM3換代的過程中。據(jù)Trendforce數(shù)據(jù),預(yù)計(jì)到2024年,HBM3市占率將超過60%,三星、美光等存儲(chǔ)芯片廠都在積極布局,都對(duì)SK海力士的市場(chǎng)份額虎視眈眈。
臺(tái)積電:根本忙不過來
先進(jìn)封裝則是一項(xiàng)與HBM內(nèi)存相輔相成的技術(shù)——要用HBM堆棧,必須用先進(jìn)封裝把內(nèi)存和GPU連接起來。
H100上使用的臺(tái)積電CoWoS先進(jìn)封裝,是一項(xiàng)2.5D封裝技術(shù)。
主流的2D封裝方案,是在基板(Substrate)的表面水平安裝所有芯片和無源器件的集成方式,類似于平面的拼圖。
而2.5D先進(jìn)封裝,則可以類比為橫向排列的積木。多層DDR芯片堆疊的HBM堆棧,必須依賴先進(jìn)封裝才能實(shí)現(xiàn)。
臺(tái)積電的CoWoS先進(jìn)封裝方案,由CoW和oS組合而來:先將芯片通過Chip on Wafer(CoW)的封裝制程連接至硅晶圓,再把CoW芯片與基板連接(on Substrate),整合成CoWoS。
CoWoS技術(shù)大大提高了互聯(lián)密度以及數(shù)據(jù)傳輸帶寬,同時(shí)縮小了封裝尺寸,但工藝也非常復(fù)雜,因此主要用于高端市場(chǎng)。
據(jù)媒體報(bào)道,目前臺(tái)積電CoWoS封裝月產(chǎn)8000片,今年底有望提升至11000片,2024年底有望實(shí)現(xiàn)14500至16600片左右的月產(chǎn)能,也就是說,想要提升一倍的產(chǎn)量,幾乎需要一年半的時(shí)間。
AI企業(yè)獲利還要再等五到十年?
根據(jù)分析平臺(tái)Similarweb的數(shù)據(jù),ChatGPT的每月在線訪問量在經(jīng)歷了數(shù)月的增長后,分別在6月和7月下降了10%。圖片生成式AI平臺(tái)Midjourney的月訪問量在截至7月的3個(gè)月內(nèi)連續(xù)下降。
指數(shù)風(fēng)投(Index Ventures)合伙人Mark Goldberg表示,商業(yè)人工智能應(yīng)用的出現(xiàn)曾經(jīng)被寄予“光速實(shí)現(xiàn)”的樂觀預(yù)期,但現(xiàn)在“出現(xiàn)了一種淺層次的幻滅感”:ChatGPT的初始用戶增長激增,導(dǎo)致投資者高估了消費(fèi)者將使用由生成式人工智能驅(qū)動(dòng)的工具的速度。
投資者在這些產(chǎn)品尚未擁有客戶或收入之前便急于支持正在建設(shè)這些產(chǎn)品的初創(chuàng)公司,這引發(fā)了對(duì)市場(chǎng)可能過熱的擔(dān)憂。
風(fēng)險(xiǎn)投資者表示,他們?nèi)匀徊淮_定圍繞這項(xiàng)技術(shù)構(gòu)建新產(chǎn)品的初創(chuàng)公司的獲勝商業(yè)模式是什么樣的——許多初創(chuàng)企業(yè)尚未證明他們能否留住用戶,并開發(fā)出現(xiàn)有公司難以輕易模仿的產(chǎn)品。
由于盈利模式不確定,一些公司已經(jīng)對(duì)于向生成式人工智能的投資提出了懷疑。
據(jù)小i集團(tuán)董事局主席&首席執(zhí)行官袁輝的說法,ChatGPT意味著整個(gè)產(chǎn)業(yè)的變革升級(jí),很多行業(yè)將會(huì)被重塑,是一個(gè)顛覆性的創(chuàng)新。他說,“沒有一次工業(yè)革命可以與人工智能相提并論。過去工業(yè)革命還是在某個(gè)領(lǐng)域或某一地區(qū)以某個(gè)國家為主導(dǎo),但現(xiàn)在AI已經(jīng)沒有邊界了。”
“ChatGPT對(duì)人類將有兩個(gè)重大影響?!痹x稱,一是接下來五到十年是AI的技術(shù)紅利,是六十年積累后巨大的紅利變現(xiàn)期;二是AI發(fā)展正在加速,早期曾預(yù)言這需要三十年五十年甚至更長時(shí)間。
ChatGPT已經(jīng)可以快速進(jìn)入到各行各業(yè)并產(chǎn)生價(jià)值,但袁輝提醒道,ChatGPT未來面臨著三個(gè)關(guān)鍵的挑戰(zhàn)。一是需要可控,就是從意識(shí)形態(tài)、倫理道德上來講必須可控,否則將極度不安全;二是如與行業(yè)結(jié)合,必須得可定制;第三是可交付?!八欢ㄒ獙?shí)現(xiàn)可控可交付可定制才能在行業(yè)中大規(guī)模地變現(xiàn)?!彼f。
