智譜AI近日推出視頻生成領(lǐng)域重磅產(chǎn)品——清影2.0,該模型在文本生成視頻技術(shù)上實(shí)現(xiàn)突破性進(jìn)展。用戶僅需輸入文字描述,即可生成分辨率達(dá)1080P的高清視頻,單段視頻最長(zhǎng)可達(dá)10秒。與前代產(chǎn)品相比,新版本在人物動(dòng)作連貫性、鏡頭運(yùn)動(dòng)軌跡以及畫(huà)面風(fēng)格呈現(xiàn)等方面均由AI自主決策,無(wú)需人工干預(yù)即可完成專業(yè)級(jí)運(yùn)鏡效果。
技術(shù)團(tuán)隊(duì)透露,清影2.0基于自主研發(fā)的CogVideoX架構(gòu),在多維度實(shí)現(xiàn)創(chuàng)新突破。該模型支持批量生成功能,用戶可同時(shí)創(chuàng)建多個(gè)視頻方案;在鏡頭控制方面,可精準(zhǔn)實(shí)現(xiàn)推、拉、搖、移等復(fù)雜運(yùn)鏡手法;風(fēng)格化創(chuàng)作方面,內(nèi)置賽博朋克、水墨丹青、膠片質(zhì)感等十余種視覺(jué)風(fēng)格模板,用戶通過(guò)自然語(yǔ)言指令即可切換不同藝術(shù)表現(xiàn)形式。配套發(fā)布的CogSound音效模型更形成完整創(chuàng)作閉環(huán),系統(tǒng)可自動(dòng)識(shí)別視頻內(nèi)容并匹配環(huán)境音效與動(dòng)作聲效,實(shí)現(xiàn)視聽(tīng)同步的沉浸式體驗(yàn)。
產(chǎn)品落地層面,清影2.0已全面接入智譜清言移動(dòng)端應(yīng)用,普通用戶可免費(fèi)體驗(yàn)基礎(chǔ)功能。針對(duì)企業(yè)級(jí)需求,平臺(tái)開(kāi)放API接口并提供私有化部署方案,金融、電商、廣告、影視等行業(yè)客戶可根據(jù)業(yè)務(wù)場(chǎng)景定制專屬視頻生成模型。官方數(shù)據(jù)顯示,自初代產(chǎn)品上線首月即收獲超百萬(wàn)次創(chuàng)作請(qǐng)求,此次升級(jí)通過(guò)算法優(yōu)化將推理成本降低30%,在保持畫(huà)質(zhì)與生成速度的同時(shí),進(jìn)一步降低AI視頻創(chuàng)作門(mén)檻。
實(shí)測(cè)對(duì)比顯示,清影2.0在中文語(yǔ)境理解方面表現(xiàn)突出,對(duì)文化意象、成語(yǔ)典故等本土化內(nèi)容的視覺(jué)轉(zhuǎn)化準(zhǔn)確率顯著提升。生成效率方面,復(fù)雜場(chǎng)景視頻的產(chǎn)出時(shí)間較同類(lèi)產(chǎn)品縮短40%,畫(huà)面穩(wěn)定性達(dá)到行業(yè)領(lǐng)先水平。目前該技術(shù)已形成完整工具鏈,用戶可通過(guò)指定項(xiàng)目地址https://yimingli-page.github.io/獲取詳細(xì)技術(shù)文檔與開(kāi)發(fā)指南。














