中國電信發(fā)布全自研視頻生成大模型等
關(guān)鍵詞: 中國電信 人工智能 大模型 視頻 華為
科技日報記者 羅云鵬
12月3日,中國電信人工智能研究院(TeleAI)在中國電信“2024數(shù)字科技生態(tài)大會”期間發(fā)布視頻生成大模型、視覺大模型產(chǎn)用一體化平臺、具身智能、智傳網(wǎng)等一系列創(chuàng)新技術(shù)、產(chǎn)品及科研成果,并發(fā)布開發(fā)者產(chǎn)業(yè)聯(lián)盟計劃。
本次發(fā)布的視頻生成大模型打造了“VAST(Video As Storyboard from Text)二階段視頻生成技術(shù)”,通過文本描述可精準(zhǔn)勾勒出包含視頻構(gòu)圖、主體目標(biāo)位置及人物姿態(tài)等關(guān)鍵信息的“故事板”(Storyboard),進(jìn)而生成對應(yīng)的視頻內(nèi)容。
得益于VAST的創(chuàng)新能力,視頻生成大模型可以保證單個或多個主體人物在各視頻片段中的外觀一致性,實現(xiàn)對復(fù)雜動作和交互式動作的精確控制,并讓角色和目標(biāo)物體的運動符合物理規(guī)律。
基于此,通過語義、語音、文生圖、文生視頻等全棧大模型能力打通短劇及影視制作各個環(huán)節(jié),覆蓋文字腳本撰寫、分鏡腳本繪制、視頻拍攝及剪輯、配音及音效合成等全流程。
大會期間,中國電信人工智能研究院還與華為、中興、亞信科技等在內(nèi)的19家合作伙伴發(fā)布中國電信人工智能開發(fā)者產(chǎn)業(yè)聯(lián)盟計劃,旨在聚合各方力量,加快推動人工智能產(chǎn)業(yè)發(fā)展,提升技術(shù)能力與應(yīng)用水平,并為全球開發(fā)者賦能。
