本報訊 (記者袁傳璽)4月15日,可靈AI舉行“靈感成真”2.0模型發布會,宣布基座模型再次升級,面向全球正式發布可靈2.0視頻生成模型及可圖2.0圖像生成模型。
數據顯示,自去年6月份發布以來,可靈AI已累計完成超20次迭代,截至目前,全球用戶規模突破2200萬。來自世界各地的超1.5萬開發者和企業客戶,將可靈的API應用于不同的行業場景中。
據悉,可靈2.0模型在動態質量、語義響應、畫面美學等維度,保持全球領先;可圖2.0模型在指令遵循、電影質感及藝術風格表現等方面顯著提升。
快手高級副總裁、社區科學線負責人蓋坤介紹,兩款模型在團隊內部的多項勝負率評測中,均穩居業內第一。例如在文生視頻領域,可靈2.0對比谷歌Veo2的勝負比為205%,對比Sora的勝負比達367%,在文字相關性、畫面質量、動態質量等維度上顯著超越對手。
作為全球首個用戶可用的DiT視頻生成模型,截至目前,可靈AI全球用戶規模已突破2200萬,累計生成1.68億個視頻及3.44億張圖片素材。自去年6月上線至今的10個月時間里,可靈AI的月活用戶數量增長25倍。
一直以來,可靈AI致力于提升模型基礎質量和模型效果,并引入更多創新功能,以滿足用戶的多樣化需求。在本次2.0模型的迭代中,可靈AI正式發布AI視頻生成的全新交互理念Multi-modal Visual Language(MVL),讓用戶能夠結合圖像參考、視頻片段等多模態信息,將腦海中包含身份、外觀、風格、場景、動作、表情、運鏡在內的多維度復雜創意,直接高效地傳達給AI。
基于MVL理念,可靈AI正式推出多模態編輯功能。“從今天起,大家可以在可靈AI的平臺上體驗我們的多模態編輯能力。用戶可以非常直接地把自己的想法用圖像等方式作為輸入,生成符合自己想法的創意視頻。”蓋坤介紹,MMW(多模態描述子)將不只局限于圖片和視頻,也可以引入其它模態的信息,例如聲音、運動軌跡等,讓用戶實現更加豐富的表達。
基于MVL這一全新交互方式,發布會現場,快手副總裁、可靈AI負責人張迪發布了全新的可靈2.0大師版,在語義響應、動態質量、畫面美學等方面顯著提升生成效果。
“可靈2.0大師版不僅僅是一次簡單的技術升級,更是一次全方位的體驗躍升。”張迪介紹,可靈2.0大師版實現了技術、體驗、美學的三重突破。
除了C端訂閱用戶,可靈AI也面向B端商家提供API接入等服務。目前,可靈AI已與包括小米、亞馬遜云科技、阿里云、Freepik、藍色光標等在內的數千家國內外企業客戶建立了合作關系。
蓋坤披露,來自世界各地的超1.5萬開發者,已將可靈的API應用于不同的行業場景中,累計生成的圖像數量約1200萬個,生成的視頻素材超過4000萬個。
如今,可靈正在成為AI時代視頻創作的新基礎設施。AIGC技術的迅猛發展,也正在重構包括廣告營銷、專業創作、影視、娛樂創意等在內的多個行業。
面向未來,蓋坤表示,可靈AI將持續大力推動技術創新,用人與AI交互的全新語言,幫助用戶實現復雜創意的精確表達,“我們的初心,是讓每個人都能用AI講出好的故事,我們也真切地希望這一天更快到來。”他表示。
(編輯 張昕)
02:04 | 模壓成型裝備行業景氣度回 升伊之... |
02:04 | 半導體設備行業持續回暖 多家上市... |
02:04 | 多肽業務貢獻業績增量 藥明康德一... |
02:04 | 圓通速遞去年營收超690億元 競爭優... |
02:04 | 上峰水泥“一主兩翼”戰略成效顯著... |
02:04 | 賽力斯擬赴港上市募資 凈額70%將用... |
02:04 | 從原糧種植到產業協同 “白酒+”重... |
02:04 | 深藍汽車CEO鄧承浩:堅持技術創新... |
02:04 | ?上汽通用總經理盧曉:堅定走電動... |
02:04 | 藍色光標CEO潘飛:AI驅動商業模式... |
02:04 | 券商研究所人才爭奪正酣 外引內培... |
02:04 | 年內28家信用卡分中心“退場”區域... |
版權所有《證券日報》社有限責任公司
互聯網新聞信息服務許可證 10120240020增值電信業務經營許可證 京B2-20250455
京公網安備 11010602201377號京ICP備19002521號
證券日報網所載文章、數據僅供參考,使用前務請仔細閱讀法律申明,風險自負。
證券日報社電話:010-83251700網站電話:010-83251800 網站傳真:010-83251801電子郵件:[email protected]
安卓
IOS
掃一掃,加關注
掃一掃,加關注