滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 手機(jī)快報(bào) > 正文內(nèi)容

蘋(píng)果STARFlow-V視頻模型革新：歸一化流技術(shù)助力30秒長(zhǎng)視頻穩(wěn)定生成

時(shí)間：2025-12-08 13:22:58 來(lái)源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評(píng)論無(wú)障礙通道

蘋(píng)果公司近日推出了一款名為STARFlow-V的新型視頻生成模型，該模型在技術(shù)路徑上與當(dāng)前主流的擴(kuò)散模型截然不同，轉(zhuǎn)而采用“歸一化流”技術(shù)，旨在提升長(zhǎng)視頻生成的穩(wěn)定性和減少錯(cuò)誤累積。這一創(chuàng)新技術(shù)直接學(xué)習(xí)隨機(jī)噪聲與復(fù)雜視頻數(shù)據(jù)之間的數(shù)學(xué)變換，為視頻生成領(lǐng)域帶來(lái)了新的可能性。

傳統(tǒng)擴(kuò)散模型通過(guò)多步迭代去噪生成視頻，而STARFlow-V的“歸一化流”技術(shù)則實(shí)現(xiàn)了訓(xùn)練過(guò)程的單次完成，無(wú)需多次小迭代，顯著提高了訓(xùn)練效率。在生成速度方面，該模型訓(xùn)練完成后可直接輸出視頻，無(wú)需迭代計(jì)算，生成速度大幅提升。由于減少了逐步生成過(guò)程中的錯(cuò)誤累積，STARFlow-V在生成質(zhì)量上也表現(xiàn)出色。

蘋(píng)果公司表示，STARFlow-V是首個(gè)在視覺(jué)質(zhì)量和生成速度上能與擴(kuò)散模型相媲美的技術(shù)。通過(guò)并行處理和重用先前幀數(shù)據(jù)，該模型生成五秒視頻的速度較初始版本提升了約15倍。這一優(yōu)勢(shì)使其在處理長(zhǎng)視頻時(shí)更具競(jìng)爭(zhēng)力。

針對(duì)長(zhǎng)視頻生成中常見(jiàn)的誤差累積問(wèn)題，STARFlow-V采用了雙架構(gòu)設(shè)計(jì)。一個(gè)組件負(fù)責(zé)管理跨幀的時(shí)間序列，確保運(yùn)動(dòng)一致性；另一個(gè)組件則優(yōu)化單個(gè)幀內(nèi)的細(xì)節(jié)，提升畫(huà)面質(zhì)量。這種設(shè)計(jì)使STARFlow-V在長(zhǎng)達(dá)30秒的演示片段中保持了穩(wěn)定性，而競(jìng)爭(zhēng)對(duì)手如NOVA和Self-Forcing在幾秒后便出現(xiàn)模糊或色彩失真。

STARFlow-V的多功能性也是其一大亮點(diǎn)。該模型無(wú)需修改即可處理多種任務(wù)，包括文本轉(zhuǎn)視頻、圖像轉(zhuǎn)視頻（將輸入圖像作為起始幀）以及視頻編輯（允許用戶添加或刪除對(duì)象）。這種靈活性使其在不同應(yīng)用場(chǎng)景中具有廣泛潛力。

在性能表現(xiàn)方面，STARFlow-V在VBench基準(zhǔn)測(cè)試中獲得了79.7分。雖然落后于Veo3（85.06）和HunyuanVideo（83.24）等頂尖擴(kuò)散模型，但它明顯優(yōu)于其他自回歸模型，尤其在空間關(guān)系和人體表征方面表現(xiàn)突出。然而，該模型仍存在一些局限，例如分辨率相對(duì)較低（640×480，16幀/秒），且目前無(wú)法在標(biāo)準(zhǔn)顯卡上實(shí)時(shí)使用。

更值得關(guān)注的是，STARFlow-V在物理模擬方面存在明顯缺陷。例如，在演示中出現(xiàn)了“章魚(yú)穿過(guò)玻璃”和“石頭憑空出現(xiàn)”等不符合物理規(guī)律的現(xiàn)象。蘋(píng)果公司承認(rèn)這些限制，并表示未來(lái)將專注于加快計(jì)算速度、縮小模型規(guī)模，以及使用更注重物理精確性的訓(xùn)練數(shù)據(jù)。

目前，STARFlow-V的相關(guān)代碼已在GitHub上公開(kāi)，模型權(quán)重也將隨后在Hugging Face上發(fā)布。這一舉措為研究人員和開(kāi)發(fā)者提供了進(jìn)一步探索和改進(jìn)該模型的機(jī)會(huì)。

12-08

BBA價(jià)格防線松動(dòng)，嵐圖追光L攜硬核配置，華系豪華能否改寫(xiě)市場(chǎng)格局？

12-08

余承東官宣：12月9日鴻蒙智行年度直播，43個(gè)月交付破百萬(wàn)引期待

12-08

特斯拉FSD V14.2.1實(shí)測(cè)：自動(dòng)駕駛下發(fā)短信，多項(xiàng)優(yōu)化更趨“完全版”

12-08

華為閃耀2025數(shù)智科技生態(tài)大會(huì)，全場(chǎng)景智慧生態(tài)引領(lǐng)科技新征程

12-08

別克至境世家：以全能實(shí)力，開(kāi)啟新能源旗艦MPV價(jià)值新紀(jì)元

12-08

37.99萬(wàn)起售！嵐圖泰山杭州上市，以東方美學(xué)與科技重塑豪華SUV新標(biāo)桿

12-08

武漢試駕哈弗H6L：以越級(jí)實(shí)力，為家庭出行開(kāi)啟“升艙”新體驗(yàn)

12-08

第五代帝豪西安上市：空間智能安全全面進(jìn)階，重塑10萬(wàn)級(jí)家轎新標(biāo)桿

12-08

蘋(píng)果CEO庫(kù)克手部偶現(xiàn)顫抖內(nèi)部高管特努斯成下一任CEO熱門(mén)人選

12-08

iPhone 18系列測(cè)試屏下Face ID 靈動(dòng)島尺寸縮減或掀換機(jī)潮

12-08

vivo S50 Pro Mini現(xiàn)身Geekbench：驍龍8 Gen5加持多核性能飆至9344

12-08

英特爾或2028年起為蘋(píng)果代工部分芯片蘋(píng)果供應(yīng)鏈將迎新變化

12-08

新能源車(chē)越做越大還降價(jià)？三大因素推動(dòng)，車(chē)企各展絕技搶市場(chǎng)

12-08

車(chē)企堅(jiān)持用1.5T增程器遭質(zhì)疑，實(shí)則背后有這些合理考量

12-08

點(diǎn)擊查看更多 +

全站最新

2025年前三季度全球車(chē)企財(cái)務(wù)數(shù)據(jù)揭曉：豐田大眾領(lǐng)跑，多車(chē)企各展實(shí)力

小米汽車(chē)定制服務(wù)啟交付紫水晶車(chē)漆SU7 Ultra成首單亮點(diǎn)

昊鉑S600申報(bào)信息亮相增程純電雙版本轎跑造型設(shè)計(jì)吸睛

耐世特早盤(pán)漲近7% 機(jī)構(gòu)：新國(guó)標(biāo)助力線控轉(zhuǎn)向量產(chǎn)前景可期

BBA價(jià)格防線松動(dòng)，嵐圖追光L攜硬核配置，華系豪華能否改寫(xiě)市場(chǎng)格局？

smart精靈6號(hào)即將登場(chǎng)：梅賽德斯設(shè)計(jì)加持，超長(zhǎng)續(xù)航掀背轎車(chē)新選擇

熱門(mén)內(nèi)容

本欄最新

別克至境世家：以全能實(shí)力，開(kāi)啟新能源旗艦MPV價(jià)值新紀(jì)元

37.99萬(wàn)起售！嵐圖泰山杭州上市，以東方美學(xué)與科技重塑豪華SUV新標(biāo)桿

武漢試駕哈弗H6L：以越級(jí)實(shí)力，為家庭出行開(kāi)啟“升艙”新體驗(yàn)

第五代帝豪西安上市：空間智能安全全面進(jìn)階，重塑10萬(wàn)級(jí)家轎新標(biāo)桿

新能源車(chē)越做越大還降價(jià)？三大因素推動(dòng)，車(chē)企各展絕技搶市場(chǎng)

車(chē)企堅(jiān)持用1.5T增程器遭質(zhì)疑，實(shí)則背后有這些合理考量

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無(wú)障礙技術(shù)由太陽(yáng)灣捐增，為閱讀障礙用戶提供內(nèi)容聽(tīng)讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 聯(lián)系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

蘋(píng)果STARFlow-V視頻模型革新：歸一化流技術(shù)助力30秒長(zhǎng)視頻穩(wěn)定生成

日本精品一区二区三区高清久久