阿里近日正式推出其最新研發的萬相2.6系列模型,為專業影視制作與圖像創作領域帶來突破性升級。作為國內首款具備角色扮演能力的視頻生成模型,該系列在功能創新上邁出重要一步,不僅支持多鏡頭切換與音畫同步技術,還實現了通過聲音驅動角色動作的交互模式。
技術團隊介紹稱,萬相2.6系列針對影視行業復雜場景需求進行深度優化,其多鏡頭生成功能可自動完成運鏡軌跡規劃,配合音畫同步技術,能精準匹配背景音樂節奏與畫面動態變化。角色扮演功能則允許用戶通過文本指令設定虛擬角色,模型可自主生成符合人物設定的表情與肢體語言,顯著提升內容創作效率。
在應用層面,該模型已開放雙重使用渠道:個人創作者可通過萬相官方網站直接體驗基礎功能,而企業用戶則能借助阿里云百煉平臺調用標準化API接口,實現批量化內容生產。這種分層服務模式既滿足個體創作者的探索需求,也為影視制作公司、廣告機構等提供工業化解決方案。
據測試數據顯示,萬相2.6系列在角色一致性保持、場景轉換流暢度等核心指標上達到行業領先水平。其聲音驅動功能支持中英文雙語識別,可解析不同語調特征并轉化為對應的面部微表情,為短視頻創作、動畫制作等領域開辟新的技術路徑。









