高通2024年將發(fā)布哪些芯片?更大的“野心”在AI PC
誰能想到,2024年剛開年,高通就在“大沖刺”一般地加快步伐了。
根據(jù)知名爆料數(shù)碼博主@數(shù)碼閑聊站透露,高通將于近期發(fā)布驍龍7+ Gen3以及驍龍8sGen3兩款處理器,從命名方式和現(xiàn)階段透露的參數(shù)來看,兩者的定位應該都是中端市場,但有意思的是:驍龍7+ Gen3會是史上最強的驍龍7系處理器,甚至有可能威脅到當今旗艦驍龍8 Gen3的地位。
這就讓小雷有些摸不著頭腦了,按照高通之前的產(chǎn)品策略,一般都是讓8系作為真旗艦,7系則是在兩三千元檔手機市場中「大殺四方」,為何今年一開年就要推出兩款定位中端且實力遠超市場預期的處理器呢?
驍龍7+ Gen3,人稱“小8 Gen3”?
驍龍7+ Gen3相比去年發(fā)布的驍龍7 Gen3可謂是進步明顯,在性能和能耗上都實打實地達到了旗艦水準。此話并非空穴來風,驍龍7+ Gen3采用的是驍龍8 Gen 3同款架構,也就是「1+4+3」的旗艦架構,內(nèi)部核心也同樣為Cortex-X4(超大核)、Cortex-A720(中核)、Cortex-A520(小核),唯一的區(qū)別在于頻率方面有一定的閹割。不過GPU部分倒是從Adreno 750縮水成了Adreno 732,對于重度手游玩家來說可能有一定的影響。
其中閹割最明顯的莫過于Cortex-X4超大核,從3.3GHz的睿頻降到了2.8GHz,這0.5GHz的差異會讓驍龍7+ Gen3在超高負載場景下的性能表現(xiàn)被驍龍8 Gen3拉開一截,但也只是超高負載場景,像日常使用以及一些常規(guī)的高負載場景,兩者的差距幾乎可以視為0,你甚至可以把它看作是驍龍8 Gen2的加強版。
而驍龍8s Gen3和8 Gen3的差距就更小了,兩者無論是在核心和GPU方面的差異都在10%以內(nèi),但功耗部分卻有明顯的下降,如此細微的差距讓小雷有些難以理解。
唯一讓小雷覺得合理的部分是,目前曝光將搭載這兩款處理器的機型均是兩三千元檔的中端手機,雖說產(chǎn)品力也相當不俗,但對比起各家的旗艦仍有不小的差距。
驍龍全新旗艦芯來了!
高通宣布將在 3 月 18 日舉行驍龍旗艦新品發(fā)布會,屆時將帶來全新的驍龍旗艦芯片產(chǎn)品。雖然目前高通并未透露關于新芯片的更多信息,不過已經(jīng)有不少可靠消息被披露。
首先高通即將推出的旗艦芯片共有兩款,分別是驍龍 8s Gen3 和驍龍7+ Gen3,其核心架構繼承驍龍8 Gen3,技術上也與之同代同系,均采用臺積電 4nm 工藝制造,定位新一代次旗艦 5G 芯片平臺。
在核心規(guī)格上,驍龍 8s Gen3 的 CPU 由 1 × Cortex X4 超大核心(3.01GHz)、4 × A720 大核心(2.61GHz )和 3 × A520 小核心(1.84GHz )組成,圖形處理器 GPU 為 Adreno 735。
從這里可以發(fā)現(xiàn),驍龍 8s Gen3 最高主頻 3.01GHz 要低于驍龍 8 Gen3 的 3.30GHz,換句話來說,前者是后者的降頻版,其綜合性能介于驍龍8 Gen2 和驍龍8 Gen3 之間,預計安兔兔跑分在 170 萬分附近,這與大眾“8s”名稱會強于“8”的普遍認知相悖。
沒錯,驍龍 8s Gen3 可以理解為是驍龍 8 Gen3 青春版,理論上其續(xù)航和發(fā)熱表現(xiàn)會更好。
高通驍龍7+ Gen 3 同樣采用“1+4+3”的核心架構,分別是 1 × Cortex X4(2.9GHz)+ 4 × A720(2.6GHz )+ 3 × A520(1.9GHz ),GPU為 Adreno 732。
可以發(fā)現(xiàn),驍龍 7+ Gen3 最高主頻 2.9GHz 要低于驍龍 8s Gen3 的 3.01GHz,也就是說驍龍 7+ Gen3 可以理解為驍龍 8s Gen3 的青春版。
驍龍7+ Gen 3 的綜合性能“plus”如其名,將會顯著超過驍龍7 Gen3 和驍龍7+ Gen2,安兔兔跑分超 150 萬,性能介于驍龍8+ Gen1 和驍龍8 Gen2 之間。
高通的AI野心
作為全球芯片巨頭,高通公司在本次MWC上也發(fā)布了多款AI賦能的重磅產(chǎn)品,并帶來多個生成式AI方面的展示。
去年10月,高通發(fā)布了面向手機的第三代驍龍8移動平臺,以及面向PC的驍龍X Elite平臺,引起了全行業(yè)的轟動。
這兩款平臺,都在AI能力上進行了重點升級。第三代驍龍8甚至被稱為首款“專為生成式AI”而精心打造的移動平臺,采用基于異構計算架構的高通AI引擎,其中Hexagon NPU等AI計算硬件全面加強,大幅提升了終端側的AI能力。
第三代驍龍8可處理的大模型參數(shù)超過100億,每秒可生成高達20個Token。而驍龍X Elite更是支持PC運行超過130億參數(shù)的大模型,運行70億參數(shù)大模型每秒生成30個Token。如果把這個衡量標準放在具體情境中,普通人每分鐘可閱讀約200-300個單詞,這相當于每秒處理5-7個tokens,而驍龍的終端側AI的書寫速度比人們的閱讀速度還要快。這種底層AI能力堪稱是顛覆性的。
正是基于驍龍強大的平臺,小米、榮耀、OPPO、iQOO、一加、三星等廠商自去年年底發(fā)布的眾多智能手機旗艦產(chǎn)品,才擁有卓越的終端側AI能力,能夠對AIGC大模型在終端落地提供支持。同時,在即時性、可靠性、隱私以及個性化等方面,也帶來了顯著的提升。
高通在本次MWC上的發(fā)布,重點聚焦在通信連接能力上。
他們推出了兩個重要的解決方案,分別是高通FastConnect 7900系統(tǒng),以及驍龍X80 5G調制解調器及射頻系統(tǒng)。
雙管齊下,推動終端側生成式 AI 生態(tài)建設
而在軟件和應用生態(tài)建設方面,高通則是同時“兩手發(fā)力”,一方面在軟件層面為開發(fā)者打造生成式 AI 應用提供便利,另一方面則是積極和終端以及應用廠商合作,推動生成式 AI 創(chuàng)意應用以及終端產(chǎn)品的落地。
比如高通一開始就意識到,讓開發(fā)者能夠獲取基于異構計算的 AI 加速,對于終端側生成式 AI 的規(guī)?;瘮U展至關重要,因此他們打造了 AI 軟件棧(Qualcomm AI Stack)。它能夠支持目前所有的主流 AI 框架,包括 TensorFlow、PyTorch、ONNX、Keras;它還支持所有主流的 AI runtime,包括 DirectML、TFLite、ONNX Runtime、ExecuTorch,以及支持不同的編譯器、數(shù)學庫等 AI 工具。
此外他們還推出了 Qualcomm AI studio,為開發(fā)者提供開發(fā)過程中需要用到的相關工具,其中包括支持模型量化和壓縮的高通 AI 模型增效工具包(AIMET),能夠讓模型運行更加高效。高通 AI 軟件棧是當前邊緣側的業(yè)界領先解決方案。
同時,高通還專注于 AI 模型優(yōu)化,以實現(xiàn)能效和性能提升。他們認為,快速的小型 Al 模型如果只能提供低質量或不準確的結果,那么將失去實際用處。因此,高通采用了全面而有針對性的策略,包括量化、壓縮、條件計算、神經(jīng)網(wǎng)絡架構搜索(NAS) 和編譯,在不犧牲太多準確度的前提下縮減 Al 模型,使其高效運行。即使是那些已經(jīng)面向移動終端優(yōu)化過的模型我們也會進行這一工作。
例如,量化有益于提升性能、能效、內(nèi)存帶寬和存儲空間。Hexagon NPU 原生支持 INT4,高通 AI 模型增效工具包(AIMET)5 提供基于高通 AI 研究技術成果開發(fā)的量化工具,能夠在降低位數(shù)精度的同時限制準確度的損失。
對于生成式 AI 來說,由于基于 Transformer 的大語言模型(比如 GPT、Bloom 和 Llama)受到內(nèi)存的限制,在量化到 8 位或 4 位權重后往往能夠獲得大幅提升的效率優(yōu)勢。
高通的這些努力也帶來了現(xiàn)實中實際應用的意義,從去年下半年到今年,不少手機廠商都在自家的產(chǎn)品中引入了端側 AI 大模型,這背后本質上就離不開與高通的深入合作攻關。以 OPPO 為例,他們在 OPPO Find X7 旗艦手機中搭載了自主訓練的 AndesGPT 70 億參數(shù)大模型,在此基礎上實現(xiàn)了通話摘要、AIGC 消除等熱門出圈的功能。
而 70 億參數(shù)的 AndesGPT 大模型能夠在終端上以低功耗的方式順暢運行第三代驍龍 8 平臺對 INT4 量化技術的支持也可以提供強大的助力。OPPO 已經(jīng)可以利用 INT4 量化技術實現(xiàn)對模型的大幅度壓縮,讓原本占用 28GB 內(nèi)存的模型現(xiàn)在只需要 3.9GB,降低資源需求的同時也幾乎不影響 AI 模型的輸出效果。
除了終端硬件廠商,高通也在與軟件廠商們合作推動生成式 AI 應用的落地,比如此前有報道稱,他們和國內(nèi)的慧鯉科技,面向第三代驍龍 8 開發(fā)了一個神經(jīng)網(wǎng)絡,能夠重構照片缺失的部分,即“照片擴充”,它能支持用戶對照片進行縮放,讓照片看起來具有廣角效果,即使并非用廣角鏡頭拍攝。
再回到軟件方面,今年的 MWC 上,高通還推出了全新的高通 AI Hub,可以為開發(fā)者提供全面優(yōu)化的 AI 模型庫,包括傳統(tǒng) AI 模型和生成式 AI 模型,能夠支持在驍龍和高通平臺上進行部署。
開發(fā)者只需選擇應用所需的模型以及其開發(fā)應用所使用的框架,然后確定目標平臺,例如一款特定型號的手機、或者一款特定型號的高通平臺,簡單來說,只需要幾行代碼就可以獲取模型,并將模型集成進應用程序,大大節(jié)省了開發(fā)者在應用中部署 AI 大模型的時間和工作量。
還有在 PC 方面,驍龍 X Elite 最重要的合作者莫過于微軟,高通一直在和微軟工程團隊合作優(yōu)化全新平臺的特性,微軟表示,絕大多數(shù)頂級應用都將以超快速度和能效在搭載驍龍 X Elite 計算平臺的 Windows PC 上原生運行或通過無縫仿真運行,特別是微軟自身的生產(chǎn)力應用,包括 Word, Excel, Powerpoint, Edge, Teams, OneDrive, OneNote 和 Outlook 都是原生的。
對于 Windows 11,微軟也改進了 Windows Studio Effects、宣布推出了 AI Library,在更新中為 Copilot 和 Paint 等收件箱應用程序中引入生成式 AI,還與諸如 Camo、Luminar Neo、WhatsApp 等進行合作,共同優(yōu)化 Windows 平臺的生成式 AI 應用體驗。
總之,高通正基于 AI 軟件棧和核心硬件 IP,跨過所有不同產(chǎn)品線,將應用規(guī)?;瘮U展到不同類型的終端,從智能手機到 PC、物聯(lián)網(wǎng)終端、汽車等等。這無疑為其合作伙伴以及用戶帶來顯著優(yōu)勢,開發(fā)一次就能覆蓋高通不同芯片組解決方案的不同產(chǎn)品和細分領域進行部署,極大地助力廠商和開發(fā)者將打造生成式 AI 應用的效率和收益最大化。
