美國人工智能初創(chuàng)企業(yè)Runway近日宣布推出新一代視頻生成模型Gen-4.5,這款產(chǎn)品在獨立基準測試中展現(xiàn)出超越谷歌與OpenAI同類產(chǎn)品的實力。根據(jù)AI基準測試機構(gòu)Artificial Analysis發(fā)布的Video Arena排行榜數(shù)據(jù),Gen-4.5以顯著優(yōu)勢登頂榜首,谷歌的Veo 3和OpenAI的Sora 2 Pro分別位列第二和第七。
該模型的核心突破在于對物理規(guī)律的深度理解能力。Runway團隊透露,Gen-4.5能夠精準解析文字提示中的運動軌跡與動作邏輯,在生成高清視頻時,可自然呈現(xiàn)人體動態(tài)、鏡頭運動軌跡以及事件因果關(guān)系。這種技術(shù)特性使其在影視制作、廣告創(chuàng)意等領(lǐng)域具有顯著應(yīng)用價值,目前已有媒體機構(gòu)、影視工作室、品牌方等超過120家客戶開展合作。
測試排名采用雙盲對比機制,參與者需同時觀看兩個模型生成的視頻片段并投票選擇更優(yōu)作品,整個過程完全不知曉作品歸屬方。這種評估方式確保了結(jié)果的客觀性,Gen-4.5在多輪比拼中持續(xù)保持領(lǐng)先地位。公司首席執(zhí)行官Cristóbal Valenzuela在技術(shù)分享會上強調(diào):"我們用120人的精干團隊,在七年研發(fā)周期中實現(xiàn)了對科技巨頭的超越,這印證了專注研究的力量。"
成立于2018年的Runway持續(xù)深耕視頻生成領(lǐng)域,其技術(shù)路線聚焦于構(gòu)建"世界模型"——通過海量視頻數(shù)據(jù)訓(xùn)練,使系統(tǒng)能更真實地模擬物理世界運行規(guī)律。這種技術(shù)積累為其贏得資本青睞,最新估值已達35.5億美元,投資方包括General Atlantic、英偉達等知名機構(gòu)。Valenzuela特別指出,Gen-4.5內(nèi)部代號"David"取自圣經(jīng)典故,象征著以創(chuàng)新突破行業(yè)壟斷的決心。
據(jù)技術(shù)白皮書披露,Gen-4.5的研發(fā)周期長達七年,期間經(jīng)歷多次技術(shù)迭代。該模型將通過Runway平臺、API接口及合作伙伴渠道逐步開放,首批用戶將于本周內(nèi)獲得訪問權(quán)限。Valenzuela透露,這僅是公司技術(shù)升級計劃的第一步,后續(xù)還將推出一系列重大功能更新。在談到行業(yè)格局時,他表示:"AI技術(shù)不應(yīng)被少數(shù)企業(yè)壟斷,我們致力于推動技術(shù)普惠化發(fā)展。"







