本報訊 (記者李喬宇)4月21日,昆侖萬維科技股份有限公司(以下簡稱“昆侖萬維”)SkyReels團隊正式發(fā)布并開源SkyReels-V2——全球首個使用擴散強迫(Diffusion-forcing)框架的無限時長電影生成模型,其通過結合多模態(tài)大語言模型(MLLM)、多階段預訓練(Multi-stage Pretraining)、強化學習(ReinforcementLearning)和擴散強迫(Diffusion-forcing)框架實現(xiàn)協(xié)同優(yōu)化。
SkyReels-V2不僅在技術上實現(xiàn)了突破,還提供了多種有用的應用場景,包括故事生成、圖生視頻、運鏡專家和多主體一致性視頻生成(SkyReels-A2)。
SkyReels-V2現(xiàn)已支持生成30秒、40秒的視頻,且具備生成高運動質(zhì)量、高一致性、高保真視頻的能力。
SkyReels-V2不僅在技術上實現(xiàn)了突破,還為多個實際應用場景提供了強大的支持。第一,SkyReels-V2能夠生成理論上無限時長的視頻,通過滑動窗口方法,模型在生成新幀時會參考之前生成的幀和文本提示。這種方法不僅支持時間上的擴展,還能生成具有連貫敘事的長鏡頭視頻;第二,SkyReels-V2提供了兩種圖像到視頻(I2V)的生成方法;第三,SkyReels-V2在標注攝像機運動方面表現(xiàn)出色;第四,基于SkyReels-V2基座模型,昆侖萬維研發(fā)了SkyReels-A2方案,并提出了一種新的多元素到視頻(E2V)任務,能夠?qū)⑷我庖曈X元素(如人物、物體和背景)組合成由文本提示引導的連貫視頻,同時確保對每個元素的參考圖像的高保真度。這一功能適合短劇、音樂視頻和虛擬電商內(nèi)容創(chuàng)作等應用。
作為首個商業(yè)級E2V開源模型,SkyReels-A2在E2V評估Benchmark A2-Bench中的結果表明,其一致性和質(zhì)量維度上評估與閉源模型相當。未來,昆侖萬維計劃擴展框架以支持更多輸入模態(tài),如音頻和動作,旨在構建一個統(tǒng)一的視頻生成系統(tǒng),以支持更廣泛的應用。
(編輯 張明富)
多地召開“新春第一會” 高質(zhì)量發(fā)展、改革創(chuàng)新等被“置頂”
隨著春節(jié)假期結束,全國多地在蛇年首個工作……[詳情]
02:04 | 模壓成型裝備行業(yè)景氣度回 升伊之... |
02:04 | 半導體設備行業(yè)持續(xù)回暖 多家上市... |
02:04 | 多肽業(yè)務貢獻業(yè)績增量 藥明康德一... |
02:04 | 圓通速遞去年營收超690億元 競爭優(yōu)... |
02:04 | 上峰水泥“一主兩翼”戰(zhàn)略成效顯著... |
02:04 | 賽力斯擬赴港上市募資 凈額70%將用... |
02:04 | 從原糧種植到產(chǎn)業(yè)協(xié)同 “白酒+”重... |
02:04 | 深藍汽車CEO鄧承浩:堅持技術創(chuàng)新... |
02:04 | ?上汽通用總經(jīng)理盧曉:堅定走電動... |
02:04 | 藍色光標CEO潘飛:AI驅(qū)動商業(yè)模式... |
02:04 | 券商研究所人才爭奪正酣 外引內(nèi)培... |
02:04 | 年內(nèi)28家信用卡分中心“退場”區(qū)域... |
版權所有《證券日報》社有限責任公司
互聯(lián)網(wǎng)新聞信息服務許可證 10120240020增值電信業(yè)務經(jīng)營許可證 京B2-20250455
京公網(wǎng)安備 11010602201377號京ICP備19002521號
證券日報網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務請仔細閱讀法律申明,風險自負。
證券日報社電話:010-83251700網(wǎng)站電話:010-83251800 網(wǎng)站傳真:010-83251801電子郵件:[email protected]
安卓
IOS
掃一掃,加關注
掃一掃,加關注