騰訊自研視頻編解碼芯片“滄?!币呀?jīng)量產(chǎn)并斬獲8項全球第一
近日,騰訊對外披露了其自研編解碼芯片“滄?!钡淖钚逻M展。在莫斯科國立大學舉辦的MSU硬件視頻編碼比賽中,騰訊“滄?!毙酒鼣埩怂鶇⒓拥膬蓚€賽道8項評分的全部第一。據(jù)了解,滄海芯片已在業(yè)務場景中投用數(shù)萬片,服務騰訊自研業(yè)務及公有云客戶。
此外,在最新揭曉的MSU硬件視頻編碼比賽結果中,滄海在參加的2個賽道8項評分中,全部獲得第一。從各項指標看,在同碼率下,相較于業(yè)界GPU等標品硬件,滄海能大幅改善畫面質(zhì)量;在120fps的高幀率檔位上,同等質(zhì)量下,滄海比行業(yè)領先水平進一步節(jié)省10%以上的碼率;另外,滄海芯片的單幀1080p的編碼耗時僅4毫秒,吞吐性能幾乎不受到編碼參數(shù)、視頻類型的影響。
據(jù)悉,早在2019年初,騰訊蓬萊實驗室、香農(nóng)實驗室聯(lián)合啟動了編解碼芯片”滄?!把邪l(fā)。對硬件編解碼的算法、架構和工程進行深度攻關,向高畫質(zhì)、低延遲、低成本的“不可能三角”發(fā)起挑戰(zhàn)。
基于自身在底層軟硬件架構和音視頻領域的多年積累,研發(fā)團隊對每個模塊的計算任務都作了并行拆解。通過分配不同的計算單元,從而疊加大量處理任務;為滄海芯片內(nèi)置視頻編碼加速專用功能模塊,讓流水控制邏輯更純粹,減少重復計算和分支判斷,帶來更低的功耗和成本。
滄海芯片的編碼器設計中完整實現(xiàn)了高精度運動搜索、全率失真優(yōu)化、高效自適應量化等所有主流編碼工具,并融合騰訊云軟件編碼器碼率控制等方面的領先技術,壓縮率高于市面標品35%以上。
在硬件架構上,通過將視頻預分析計算單元進一步卸載到硬件中,滄海芯片大幅減少了高密度轉碼場景下任務對CPU性能的依賴,將轉碼性能提升到更強。通過靈活的多核擴展架構、高性能編碼流水線、層級化Memory布局,滄海芯片能滿足高吞吐、低時延和實時性要求。
