滾動(dòng)資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

智源研究院Emu3.5：以多模態(tài)架構(gòu)開啟世界模型新范式

時(shí)間：2025-11-02 05:15:34 來源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評(píng)論無障礙通道

在人工智能技術(shù)快速演進(jìn)的當(dāng)下，“世界模型”概念正引發(fā)全球科研機(jī)構(gòu)與科技企業(yè)的深度探索。這一技術(shù)路徑旨在突破傳統(tǒng)AI的感知局限，使其具備對(duì)物理世界運(yùn)行規(guī)律的深層理解能力，從而實(shí)現(xiàn)從被動(dòng)響應(yīng)到主動(dòng)預(yù)測(cè)的跨越。近期，多家國際頂尖實(shí)驗(yàn)室相繼公布相關(guān)進(jìn)展，推動(dòng)該領(lǐng)域進(jìn)入新的競(jìng)爭(zhēng)階段。

行業(yè)觀察指出，當(dāng)前大語言模型發(fā)展已觸及數(shù)據(jù)天花板，單純依靠文本訓(xùn)練難以實(shí)現(xiàn)質(zhì)的突破。在此背景下，多模態(tài)融合與物理世界建模成為技術(shù)升級(jí)的關(guān)鍵方向。不同于傳統(tǒng)AI專注于圖像識(shí)別或文本生成，新一代模型試圖構(gòu)建統(tǒng)一的認(rèn)知框架，通過整合視覺、語言、動(dòng)作等多維度信息，模擬人類對(duì)環(huán)境的動(dòng)態(tài)理解過程。

某科研機(jī)構(gòu)最新發(fā)布的多模態(tài)大模型Emu3.5，在技術(shù)架構(gòu)上實(shí)現(xiàn)重要?jiǎng)?chuàng)新。該模型采用自回歸框架，突破性地統(tǒng)一了圖像、文本與視頻的生成機(jī)制，其核心能力在于預(yù)測(cè)下一個(gè)狀態(tài)變化。研究人員解釋，這種設(shè)計(jì)更接近人類認(rèn)知模式——通過連續(xù)觀察與推理構(gòu)建對(duì)世界的完整認(rèn)知。實(shí)驗(yàn)數(shù)據(jù)顯示，該模型在視頻生成速度上較傳統(tǒng)方法提升近20倍，同時(shí)保持高質(zhì)量輸出。

技術(shù)團(tuán)隊(duì)披露，Emu3.5的訓(xùn)練數(shù)據(jù)規(guī)模達(dá)10萬億token，其中包含相當(dāng)于790年時(shí)長(zhǎng)的視頻素材。通過自主研發(fā)的離散擴(kuò)散自適應(yīng)推理算法，模型在三個(gè)關(guān)鍵維度取得突破：一是高層意圖解析能力，可自動(dòng)規(guī)劃復(fù)雜任務(wù)的執(zhí)行路徑；二是動(dòng)態(tài)環(huán)境模擬，能準(zhǔn)確預(yù)測(cè)物理運(yùn)動(dòng)軌跡與因果關(guān)系；三是泛化交互能力，為機(jī)器人與真實(shí)場(chǎng)景的協(xié)作提供認(rèn)知基礎(chǔ)。例如在機(jī)器人操作測(cè)試中，模型能精準(zhǔn)判斷抓取杯子的安全角度，避免物體墜落。

針對(duì)業(yè)界將世界模型簡(jiǎn)單等同于視頻生成工具的誤解，研發(fā)負(fù)責(zé)人明確指出，物理規(guī)律理解才是技術(shù)核心。他以自動(dòng)駕駛場(chǎng)景為例：系統(tǒng)不僅要識(shí)別道路標(biāo)志，更需預(yù)測(cè)其他車輛的行駛軌跡、行人動(dòng)向以及天氣變化對(duì)路況的影響。這種跨場(chǎng)景的推理能力，正是當(dāng)前AI技術(shù)亟待突破的瓶頸。

值得注意的是，該模型在架構(gòu)設(shè)計(jì)上摒棄了主流的擴(kuò)散變換器方案，轉(zhuǎn)而從認(rèn)知科學(xué)原理出發(fā)構(gòu)建原生多模態(tài)系統(tǒng)。這種技術(shù)路線使得模型能在單一神經(jīng)網(wǎng)絡(luò)中完成感知、理解、推理與生成的全流程，為持續(xù)進(jìn)化奠定基礎(chǔ)。研究人員透露，早期版本Emu3已驗(yàn)證"下一個(gè)token預(yù)測(cè)"機(jī)制的有效性，此次升級(jí)重點(diǎn)強(qiáng)化了物理直覺與跨場(chǎng)景規(guī)劃能力。

當(dāng)前，全球科技巨頭紛紛布局世界模型領(lǐng)域。某國際實(shí)驗(yàn)室推出的交互式3D世界生成系統(tǒng)，某企業(yè)強(qiáng)化的視頻物理一致性模型，均展現(xiàn)出不同技術(shù)路徑的探索成果。與此形成對(duì)比的是，國內(nèi)科研團(tuán)隊(duì)更側(cè)重于認(rèn)知架構(gòu)的創(chuàng)新，試圖在尚未形成技術(shù)壟斷的領(lǐng)域建立原創(chuàng)標(biāo)準(zhǔn)。這種差異化競(jìng)爭(zhēng)策略，為AI技術(shù)發(fā)展提供了新的可能性。

技術(shù)倫理專家提醒，隨著AI對(duì)物理世界理解能力的增強(qiáng)，需同步建立相應(yīng)的安全評(píng)估體系。特別是在自動(dòng)駕駛、醫(yī)療機(jī)器人等高風(fēng)險(xiǎn)領(lǐng)域，模型預(yù)測(cè)的準(zhǔn)確性與可靠性直接關(guān)系到人身安全。如何確保技術(shù)發(fā)展始終處于可控范圍，將成為下一階段的重要課題。

12-06

機(jī)器人防爆防護(hù)服尺寸設(shè)計(jì)：適配性、靈活性與安全性的全面考量

本文旨在探討機(jī)器人防爆防護(hù)服的尺寸設(shè)計(jì)與應(yīng)用。為了滿足不同場(chǎng)合的需求，機(jī)器人防爆防護(hù)服的尺寸設(shè)計(jì)必須考慮多方面因素。首先，尺寸要能夠適配不同型號(hào)和大小的機(jī)器人，確保防護(hù)服能夠覆蓋機(jī)器人的主要部位。現(xiàn)代通常…

12-06

中國電信柯瑞文：以智能為翼攜手伙伴共繪數(shù)智發(fā)展新畫卷

12-06

吉利銀河V900登場(chǎng)：AI增程領(lǐng)航，重塑高端MPV全場(chǎng)景出行新體驗(yàn)

12-06

中國電信AI+綠色智算生態(tài)論壇成果豐碩發(fā)布多項(xiàng)創(chuàng)新成果與標(biāo)桿

中國電信揭榜工信部算力強(qiáng)基“算力電力協(xié)同應(yīng)用”任務(wù)，自研“云霆”算電調(diào)度平臺(tái)，聯(lián)合電網(wǎng)開展多省協(xié)同調(diào)度，并在上海實(shí)現(xiàn)全國首次“電網(wǎng)-算網(wǎng)指令級(jí)調(diào)度協(xié)同”；聯(lián)合海蘭云建成全球首個(gè)海風(fēng)直聯(lián)海底數(shù)據(jù)中心，聯(lián)合雅礱江…

12-06

OPPO朱海舟：手機(jī)行業(yè)現(xiàn)在有句話叫「摸著豆包過河」

12-06

從“互聯(lián)”到“AI”：榮威M7 DMH以“活人感”開啟車市新篇章

12-06

別克至境世家重磅登場(chǎng) 43.99萬元起開啟高端新能源MPV全新出行體驗(yàn)

12-06

吉利銀河V900登場(chǎng)：AI增程領(lǐng)航開啟高端MPV全新體驗(yàn)篇章

12-06

別克至境世家震撼登場(chǎng)，43.99萬起售開啟新能源MPV豪華新體驗(yàn)

12-06

吉利銀河V900攜超級(jí)AI增程技術(shù)登場(chǎng)，開啟MPV全場(chǎng)景智慧出行新紀(jì)元

12-06

別克至境世家上市，43.99萬起售，雙電機(jī)四驅(qū)+豐富配置實(shí)力強(qiáng)勁

12-06

別克至境世家上市！43.99萬起，多屏聯(lián)動(dòng)+高階智駕亮點(diǎn)足

12-06

別克至境世家震撼登場(chǎng)！43.99萬起售，重塑新能源MPV豪華新標(biāo)桿

12-06

中國電信柯瑞文：筑牢AI發(fā)展底座，推動(dòng)智能云體系與千行百業(yè)深度融合

12-06

點(diǎn)擊查看更多 +

全站最新

吉利銀河V900登場(chǎng)：AI增程領(lǐng)航，重塑高端MPV全場(chǎng)景出行新體驗(yàn)

汽車行業(yè)利潤(rùn)率跌至五年低谷，大變局下汽車業(yè)未來路在何方？

從出口冠軍到生態(tài)領(lǐng)航者：中國汽車以創(chuàng)新模式重構(gòu)全球產(chǎn)業(yè)新版圖

東風(fēng)日產(chǎn)NX8公告圖亮相，800V平臺(tái)+5C超充打造家庭新能源出行新標(biāo)桿

東風(fēng)日產(chǎn)NX8官圖亮相：大五座設(shè)計(jì)+800V快充家庭新能源SUV新選擇

東風(fēng)日產(chǎn)NX8公告圖發(fā)布，以800V+5C超充等實(shí)力，重塑家庭新能源SUV新格局

熱門內(nèi)容

本欄最新

吉利銀河V900登場(chǎng)：AI增程領(lǐng)航，重塑高端MPV全場(chǎng)景出行新體驗(yàn)

從“互聯(lián)”到“AI”：榮威M7 DMH以“活人感”開啟車市新篇章

別克至境世家重磅登場(chǎng) 43.99萬元起開啟高端新能源MPV全新出行體驗(yàn)

吉利銀河V900登場(chǎng)：AI增程領(lǐng)航開啟高端MPV全新體驗(yàn)篇章

別克至境世家震撼登場(chǎng)，43.99萬起售開啟新能源MPV豪華新體驗(yàn)

吉利銀河V900攜超級(jí)AI增程技術(shù)登場(chǎng)，開啟MPV全場(chǎng)景智慧出行新紀(jì)元

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 聯(lián)系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

智源研究院Emu3.5：以多模態(tài)架構(gòu)開啟世界模型新范式

日本精品一区二区三区高清久久