日日躁夜夜躁狠狠躁超碰97,无码国内精品久久综合88 ,热re99久久精品国99热,国产萌白酱喷水视频在线播放

歡迎訪問深圳市中小企業(yè)公共服務(wù)平臺電子信息窗口

為對抗英偉達,英特爾拿出全新技術(shù),AI算力不再一家獨大

2023-06-07 來源:快科技
1542

關(guān)鍵詞: 人工智能 英特爾 英偉達 芯片

AI,人工智能,這個東西其實一旦都不新鮮。

從早些年的科幻作品,到后來的逐步落地,從1997年IBM超級電腦“深藍”擊敗國際象棋大師卡斯帕羅夫,到2016年Google AlphaGo戰(zhàn)勝圍棋冠軍李世石,AI一直都在進步,也一直在演化。

但因為算力算法、技術(shù)能力、應(yīng)用場景等方面的種種限制,AI一直有些空中樓閣的感覺。

直到出現(xiàn)了ChatGPT,AI才真正引燃了普通人的熱情,讓我們發(fā)現(xiàn),AI竟然如此強大,又如此唾手可得,讓眾多個體、企業(yè)為之興奮,為之癲狂。




Intel祭出全新“殺器”

AI無論實現(xiàn)方式還是應(yīng)用場景都是多種多樣的,既有云側(cè)的,也有端側(cè)的。

NVIDIA的重點在云側(cè)和生成式AI,Intel在云側(cè)生成式、端側(cè)判定式同時出擊,而隨著越來越多的AI跑在端側(cè),更貼近普通用戶日常體驗,所帶來的提升越來越明顯,Intel更是大有可為。

端側(cè)AI,說起來大家可能會感覺很陌生,但其實,人們習(xí)以為常的背景模糊、視覺美顏、聲音美化(音頻降噪)、視頻降噪、圖像分割等等,都是端側(cè)AI的典型應(yīng)用場景,背后都是AI在努力。

這些應(yīng)用要想獲得更好的效果,就需要更完善、復(fù)雜的網(wǎng)絡(luò)模型,對于算力的需求自然也在快速增長。比如噪音抑制,算力需求已經(jīng)是兩年前的50倍,背景分割也增長了10倍以上。更不要說生成式AI模型出現(xiàn)后,對算力的渴求更是飛躍式的,直接就是數(shù)量級的提升,無論是Stable Diffusion,還是語言類GTP,模型參數(shù)都是非??鋸埖摹?/span>

比如GPT3的參數(shù)量達到了1750億左右,相比GPT2增加了幾乎500倍,GPT4估計可達到萬億級別。

這些都對硬件、算法提出了更苛刻的要求。

Intel自然也早就開始關(guān)注并投入AI,無論是服務(wù)器級的至強,還是消費級的酷睿,都在以各種方式參與AI,“XX代智能酷睿處理器”的說法就在很大程度上源于AI。在Intel看來,沒有單一的硬件架構(gòu)適用于所有的AI場景,不同硬件各有特點,有的算力強大,有的延遲超低,有的全能,有的專攻。

AI作為基礎(chǔ)設(shè)施也有各種各樣的場景應(yīng)用和需求,負載、延遲都各不相同,比如實時語音和圖像處理不需要太強的算力,但是對延遲很敏感。這時候,Intel XPU戰(zhàn)略就有著相當針對性的特殊優(yōu)勢,其中CPU適合對延遲敏感的輕量級AI處理,GPU適合重負載、高并行的AI應(yīng)用。Intel另一個無可比擬的優(yōu)勢就是穩(wěn)固、龐大的x86生態(tài),無論應(yīng)用還是開發(fā),都有著廣泛的群眾基礎(chǔ)。

現(xiàn)在,Intel又有了VPU。

將在今年晚些時候發(fā)布的Meteor Lake,會首次集成獨立的VPU單元,而且是所有型號標配,可以更高效地執(zhí)行特定AI運算。

Intel VPU單元的技術(shù)源頭來自Intel 2017年收購的AI初創(chuàng)企業(yè)Movidius,其設(shè)計的VPU架構(gòu)是革命性的,只需要1.5W功耗就能實現(xiàn)4TOPS的強大算力,能效比簡直逆天,最早用于無人機避障等,如今又走入了處理器之中,與CPU、GPU協(xié)同發(fā)力。

VPU本質(zhì)上是專為AI設(shè)計的一套新架構(gòu),可以高效地執(zhí)行一些矩陣運算,尤為擅長稀疏化處理,其超低的功耗、超高的能效非常適合一些需要長期打開并執(zhí)行的場景,比如視頻會議的背景虛化、移除,比如流媒體的手勢控制。



之所以在已經(jīng)有了CPU、GPU的情況下,還要做一個VPU,Intel的出發(fā)點是如今很多端側(cè)應(yīng)用是在筆記本上進行,對于電池續(xù)航非常敏感,高能效的VPU用在移動端就恰如其分。

另一個因素是CPU、GPU作為通用計算平臺,本身就任務(wù)繁重,再給它們增加大量AI負載,執(zhí)行效率就會大打折扣。

具體到應(yīng)用場景,VPU也是非常廣泛的,比如說視頻會議,現(xiàn)在的CPU AI已經(jīng)可以實現(xiàn)自動構(gòu)圖(Auto-Framing)、眼球跟蹤、虛擬頭像/人像、姿勢識別等等。加入低功耗、高算力的VPU之后,還可以強化背景模糊、動態(tài)降噪等處理,讓效果更加精準,比如說背景中的物體該模糊的一律模糊、人手/頭發(fā)等不該模糊的不再模糊。有了高效的硬件、合適的場景,還需要同樣高效的軟件,才能釋放全部實力、實現(xiàn)最佳效果,這對于擁有上萬名軟件研發(fā)人員的Intel來說,真不是事兒。

Meteor Lake還沒有正式發(fā)布,Intel已經(jīng)與眾多生態(tài)伙伴在VPU方面展開了合作適配,獨立軟件開發(fā)商們也非常積極。


英偉達超級芯片已經(jīng)量產(chǎn)

在最近的Computex展會上,NVIDIA的創(chuàng)始人兼首席執(zhí)行官黃仁勛正式宣布旗下首款超級芯片GH200 Grace Hopper已經(jīng)開始全面量產(chǎn)。這款超級芯片集成了NVIDIA首款Grace CPU和Hopper GPU,標志著NVIDIA兌現(xiàn)了此前的豪言壯志。

GH200 Grace Hopper的推出是為了滿足當下快速增長的AI生成需求。Grace CPU采用了AMR架構(gòu),擁有72個ARMv9內(nèi)核和117MB L3緩存。它還配備了512GB的LPDDR5X內(nèi)存,內(nèi)存帶寬高達546GB/s。而Hopper GPU則搭載了144個SM單元和96GB HBM3顯存,總計擁有18432個CUDA核心,L2緩存為60MB。這兩個組件通過專屬的NVLink交換系統(tǒng)相互結(jié)合,形成了Grace Hopper超級芯片。

令人驚嘆的是,GH200 Grace Hopper的計算能力達到了一百萬萬億次,相當于4090的12195倍。這使得它與當前最先進的超級計算機媲美,甚至超越了它們。然而,NVIDIA并沒有止步于此。

黃仁勛隨即公布了名為DGX GH200的AI超級計算機,它由256顆Grace Hopper超級芯片構(gòu)成。這款超級計算機不僅大幅提升了帶寬,達到了前一代產(chǎn)品的48倍以上,而且還引人矚目地提供了共享內(nèi)存容量高達144TB。據(jù)NVIDIA稱,DGX GH200的計算能力將超過1EB,這個計算能力超過了當前全球排名第一的超級計算機Frontier,后者的計算能力只略高于1EB。



量子計算是個好解法,但為時尚早

大模型算力之爭,短期看GPU自研,中期看存算、Chiplet,那么被投資人視為新計算方向的量子計算在其中又能扮演什么角色?

事實上,VC對量子計算的關(guān)注不只限于此次ChatGPT的熱潮,AR/VR、5G等新應(yīng)用場景的不斷涌現(xiàn),以及各類型的應(yīng)用場景爆發(fā)式增長,讓市場對算力的需求水漲船高,產(chǎn)業(yè)亟待挖掘具有顛覆性的計算形式。

量子計算作為一種新型架構(gòu)的計算,可以實現(xiàn)指數(shù)級算力提升,更可謂是不得不關(guān)注的焦點。

據(jù)企查查數(shù)據(jù)顯示,2017年至今,國內(nèi)量子計算賽道共完成31起融資事件,公開披露融資金額超25億元,融資主要發(fā)生在2021年及以后,占比近7成。其中圖靈量子、本源量子、量旋科技、玻色量子、國儀量子等在近年獲多輪融資。

對于這一疑問,量旋科技CEO項金根對量子計算跟經(jīng)典計算機的算力差距,給出了飛機和地面交通工具的比喻。

他表示,當下存算、光芯片、其他一些封裝的改進技術(shù),本質(zhì)上還是經(jīng)典計算機的范疇,它運算的原理跟GPU本質(zhì)上沒有太大改變,更多是在傳統(tǒng)的框架下做的一些改進,使得人工智能的芯片效率更高。

對于現(xiàn)有的AI芯片、存算一體或其他封裝技術(shù)對AI算力的提升,項金根表示認可,同時他也認為需要不同維度去看不同解決方案對算力的助力,這里面不一定存在最優(yōu)解。

“未來,量子計算機肯定能夠助力人工智能。AI需要的算力會越來越多,到 2030 年左右可能不光是算力,連耗電量都是非??植赖臄?shù)據(jù)級。所以要真正解決AI大規(guī)模的算力需求,量子計算機是一個很有潛力的應(yīng)用方向,而且量子計算機的運算模式跟人工智能有天然的貼合性,量子計算機可以加速AI的一些應(yīng)用場景,而AI亦可以加速量子計算的研發(fā),優(yōu)化其操控精度?!?/span>



那么,如此具有革命性的量子計算何時能應(yīng)用到AI領(lǐng)域?項金根認為,到2030年行業(yè)發(fā)展順利進入容錯量子計算階段,將可能是一個落地的時間點。

相較于項金根給出的10年之約,俞悅認為量子計算相關(guān)算法在一些行業(yè)特定任務(wù)上的嘗試落地,在這個時間點可能會有一些結(jié)果,至于解決AI的通用任務(wù)上,他則相對保守地給出了“50年”的看法。甚至投了圖靈量子的聯(lián)想創(chuàng)投也表示,量子計算從產(chǎn)業(yè)化的角度看,仍挑戰(zhàn)諸多,充滿機遇。

聯(lián)想創(chuàng)投坦言,量子計算落地需要解決百萬量子比特操縱能力、低環(huán)境要求、高集成度等核心問題,具有較高的入局門檻,其產(chǎn)業(yè)化仍面臨技術(shù)路徑不確定、人才儲備稀缺、產(chǎn)業(yè)鏈配套早期以及無法用傳統(tǒng)的邏輯、電路思維進行推導(dǎo)和復(fù)刻的四大痛點。

如此看來,這些問題待解之下,量子計算就略微顯得理想豐滿、現(xiàn)實骨感。

此外,俞悅還指出,從邏輯上說,量子計算肯定能解決很多算力問題,但即便如此,還需要結(jié)合成本,才能知道量子計算是不是一個從投入產(chǎn)出看的最佳方案。

在俞悅看來,眼下量子計算行業(yè)還未發(fā)生一些根本性的變化進展,中短期與其寄希望于其他方案來解決大模型所遇到的算力問題,不如指望GPU這些經(jīng)典計算的硬件價格能下來。

“解決算力的成本肯定會越來越便宜,GPU價格對于大模型玩家來說只是暫時的,終究不會對AI發(fā)展構(gòu)成太大瓶頸。而其他方案的成熟還需要很多配套的軟件生態(tài)匹配,相對來說更是一個非常長周期的事情?!?/span>