鳳凰網科技訊 12月16日,阿里巴巴旗下通義萬相團隊發布了新一代萬相2.6系列模型。該版本被定義為國內首個支持角色扮演功能的視頻生成模型,同時集成了音畫同步、多鏡頭生成及聲音驅動等能力。
據悉,萬相2.6在技術層面通過多模態聯合建模,可對輸入視頻的時序信息、主體特征及聲學要素進行學習,旨在實現生成視頻在畫面與聲音上的整體一致性。其分鏡控制功能可依據語義理解,將原始素材構建為包含多鏡頭切換的專業敘事段落。
此次升級重點提升了畫質、音效與指令遵循能力,單次生成視頻時長最高支持15秒。新增的角色扮演功能允許用戶上傳個人視頻并結合提示詞,模型可自動完成分鏡設計、角色演繹與配音,生成具備電影感運鏡的短片。該能力主要面向廣告設計、短劇制作等專業場景。
目前,萬相模型家族已具備文生圖、圖像編輯、文生視頻等十余種視覺創作能力。即日起,用戶可通過官網體驗萬相2.6,企業用戶也可通過阿里云百煉平臺調用模型API。














