AIPress.com.cn報(bào)道
12月5日消息,Runway 在紐約正式發(fā)布全新的文本生成視頻模型Gen-4.5,并高調(diào)宣稱其在綜合表現(xiàn)上已經(jīng)超越 OpenAI 的 Sora 2 和 Google 的 Veo 3。根據(jù)官方博客介紹,這一代模型具備更高視覺逼真度、更強(qiáng)創(chuàng)作控制能力,能夠生成電影級、細(xì)節(jié)豐富的動態(tài)畫面,甚至在光影、動作和畫質(zhì)控制上接近專業(yè)制作水準(zhǔn)。
Runway 因 2023 年推出 Gen-1 視頻模型而名聲大噪,而如今的 Gen-4.5 被稱為視頻生成能力的又一次躍升。官方表示,新模型在預(yù)訓(xùn)練效率與后訓(xùn)練算法上都有顯著提升,并在時間一致性與動作可控性方面設(shè)定了新基準(zhǔn)——也就是說,人物不會突然變臉、物體不會隨機(jī)消失,連續(xù)幀過渡更自然。
在視頻模型榜單Elo 評測中,Gen-4.5 得分1247 分,超過 Google Veo 3 的1226 分與 OpenAI Sora 2 Pro 的1206 分,以小幅優(yōu)勢奪得頭名。當(dāng)然,這也意味著它并非碾壓對手,而是領(lǐng)先但差距有限。
Runway 強(qiáng)調(diào),Gen-4.5 在保持 Gen-4 原有速度優(yōu)勢的同時,進(jìn)一步提升了生成效果。它能夠模擬真實(shí)的物理細(xì)節(jié),如液體流動、材質(zhì)紋理、頭發(fā)擺動等,并確保畫面在運(yùn)動過程中的自然一致性。視覺風(fēng)格方面,既能拍出電影質(zhì)感,也能走寫實(shí)動畫路線,適用范圍更廣。
值得注意的是,這一代模型由Runway與英偉達(dá)合作打造,訓(xùn)練與推理均基于 Blackwell 與 Hopper GPU 運(yùn)行。不過官方也坦言,這個版本仍存在一些問題,例如因果邏輯偶有偏差、物體持久性并非完美,還有“成功偏置”——本該射偏的箭可能會神奇擊中靶心。
官方表示,這些缺陷是構(gòu)建“可靠世界模型”必須面對的難題,會持續(xù)迭代優(yōu)化。當(dāng)前 Gen-4.5 已向所有訂閱用戶開放,創(chuàng)作者與企業(yè)無需額外付費(fèi)即可直接體驗(yàn)。(AI普瑞斯編譯)











