商湯科技近日宣布,正式推出并開(kāi)源其最新研發(fā)的SenseNova-SI系列空間智能大模型。這一系列模型在空間理解與推理任務(wù)中表現(xiàn)卓越,不僅顯著超越同量級(jí)開(kāi)源多模態(tài)大模型,更在多項(xiàng)國(guó)際權(quán)威評(píng)測(cè)中領(lǐng)先于GPT-5和Gemini 2.5 Pro等頂尖閉源模型,標(biāo)志著我國(guó)在空間智能領(lǐng)域取得重要突破。
當(dāng)前,主流大模型在知識(shí)儲(chǔ)備、文本生成、邏輯推理和編程能力等方面已展現(xiàn)出強(qiáng)大實(shí)力,但在空間結(jié)構(gòu)理解與推理方面仍存在明顯短板。這種能力恰恰是具身智能體與物理世界交互所需的核心基礎(chǔ)。商湯科技此次發(fā)布的SenseNova-SI系列,正是針對(duì)這一痛點(diǎn)進(jìn)行專項(xiàng)突破的創(chuàng)新成果。
該系列包含2B和8B兩種參數(shù)規(guī)模的模型版本。根據(jù)官方公布的評(píng)測(cè)數(shù)據(jù),SenseNova-SI系列在VSI、MMSI、MindCube、ViewSpatial等空間智能基準(zhǔn)測(cè)試中均取得優(yōu)異成績(jī)。其中,8B版本模型在四個(gè)核心評(píng)測(cè)中平均得分達(dá)60.99,較Qwen3-VL-8B(40.16)、BAGEL-7B(35.01)等開(kāi)源通用多模態(tài)模型,以及SpatialMLLM(35.05)、ViLaSR-7B(36.41)等專用空間智能模型均有顯著優(yōu)勢(shì)。更引人注目的是,這一輕量化模型在性能上超越了GPT-5(49.68)和Gemini-2.5-Pro(48.81)等國(guó)際頂級(jí)閉源模型。
實(shí)際測(cè)試案例進(jìn)一步驗(yàn)證了該模型的空間智能優(yōu)勢(shì)。在立方體組合圖形的俯視圖識(shí)別任務(wù)中,面對(duì)復(fù)雜三維結(jié)構(gòu),SenseNova-SI-8B準(zhǔn)確選擇正確答案,而GPT-5出現(xiàn)判斷錯(cuò)誤。在空間方位判斷場(chǎng)景中,當(dāng)測(cè)試者模擬手持相機(jī)者的視角時(shí),該模型能正確識(shí)別摩托車位于右側(cè),而GPT-5誤判為左側(cè)。在動(dòng)態(tài)場(chǎng)景理解方面,模型準(zhǔn)確預(yù)測(cè)黃色汽車將進(jìn)行右轉(zhuǎn)動(dòng)作,而GPT-5判斷為靜止?fàn)顟B(tài)。
在視角變化分析任務(wù)中,SenseNova-SI-8B展現(xiàn)出更強(qiáng)的空間推理能力。面對(duì)戶外場(chǎng)景的視角轉(zhuǎn)換,模型能精準(zhǔn)判斷物體向左前方移動(dòng);在室內(nèi)空間分析中,通過(guò)白板、沙發(fā)等家具的位置變化,同樣得出正確的移動(dòng)方向判斷。另一項(xiàng)測(cè)試中,模型從正面視角準(zhǔn)確識(shí)別桌子右側(cè)物體為門(mén),而GPT-5的判斷出現(xiàn)偏差。這些案例充分證明,該模型在空間智能領(lǐng)域已實(shí)現(xiàn)質(zhì)的飛躍。
目前,SenseNova-SI系列模型已通過(guò)開(kāi)源方式向全球開(kāi)發(fā)者開(kāi)放。相關(guān)代碼和文檔可通過(guò)指定代碼倉(cāng)庫(kù)獲取,這一舉措將為空間智能技術(shù)的研究與應(yīng)用提供重要基礎(chǔ)設(shè)施,推動(dòng)整個(gè)領(lǐng)域向更高水平發(fā)展。













