滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 數(shù)碼極客 > 正文內(nèi)容

Meta發(fā)布SAM 3模型：突破標(biāo)簽限制，3D重建與多領(lǐng)域應(yīng)用再創(chuàng)新高

時(shí)間：2025-11-20 08:51:02 來(lái)源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評(píng)論無(wú)障礙通道

meta近日宣布推出第三代“分割一切”模型Segment Anything Models（SAM）的升級(jí)版本SAM 3，同時(shí)發(fā)布面向3D重建的開(kāi)源模型SAM 3D。這款新模型在圖像與視頻分割領(lǐng)域?qū)崿F(xiàn)重大突破，首次支持通過(guò)自然語(yǔ)言描述和圖像示例實(shí)現(xiàn)動(dòng)態(tài)物體識(shí)別、分割與追蹤。相關(guān)技術(shù)將率先整合至Instagram視頻創(chuàng)作工具Edits及meta AI應(yīng)用中，并計(jì)劃通過(guò)Segment Anything Playground平臺(tái)向公眾開(kāi)放體驗(yàn)。

SAM 3的核心創(chuàng)新在于引入“可提示概念分割”（Promptable Concept Segmentation）能力，用戶僅需輸入“條紋紅色雨傘”等自然語(yǔ)言描述，模型即可自動(dòng)識(shí)別并分割圖像或視頻中所有符合條件的實(shí)例。這一技術(shù)突破擺脫了傳統(tǒng)模型依賴固定標(biāo)簽集的局限，支持開(kāi)放詞匯分割。在性能測(cè)試中，該模型在英偉達(dá)H200 GPU上處理單張含百余物體的圖像僅需30毫秒，在五目標(biāo)并發(fā)視頻場(chǎng)景中可維持接近實(shí)時(shí)處理速度。基準(zhǔn)測(cè)試顯示，其性能較現(xiàn)有系統(tǒng)提升一倍，在LVIS數(shù)據(jù)集零樣本分割任務(wù)中準(zhǔn)確率達(dá)47.0，用戶偏好測(cè)試中以三比一優(yōu)勢(shì)超越OWLv2模型。

為解決自然語(yǔ)言與視覺(jué)元素關(guān)聯(lián)難題，meta構(gòu)建了包含21.4萬(wàn)個(gè)獨(dú)特概念的SA-Co基準(zhǔn)數(shù)據(jù)集，覆蓋12.4萬(wàn)張圖像和1700個(gè)視頻，概念范圍達(dá)現(xiàn)有基準(zhǔn)的50倍以上。SAM 3支持多種提示方式，除文本描述外，還可接受點(diǎn)、框、掩碼等視覺(jué)提示，甚至能處理“坐著但沒(méi)有拿禮物盒的人”等復(fù)雜推理型指令。當(dāng)與多模態(tài)大語(yǔ)言模型配合時(shí)，其在ReasonSeg和OmniLabel等需要推理的分割任務(wù)中表現(xiàn)優(yōu)異，且無(wú)需額外訓(xùn)練數(shù)據(jù)。

在數(shù)據(jù)處理層面，meta開(kāi)發(fā)了創(chuàng)新型人機(jī)協(xié)作數(shù)據(jù)引擎。該系統(tǒng)將SAM 3、人類(lèi)標(biāo)注者與AI模型結(jié)合，形成自動(dòng)化標(biāo)注流水線：AI模型首先挖掘圖像視頻并生成初始分割掩碼，人類(lèi)與AI標(biāo)注者共同驗(yàn)證修正，形成反饋循環(huán)。其中AI標(biāo)注器基于Llama 3.2v模型訓(xùn)練，在掩碼質(zhì)量驗(yàn)證等任務(wù)中達(dá)到或超越人類(lèi)水平。這一方案使負(fù)提示標(biāo)注速度較純?nèi)斯ぬ嵘?倍，細(xì)粒度領(lǐng)域正提示標(biāo)注效率提高36%，最終構(gòu)建出包含超400萬(wàn)個(gè)獨(dú)特概念的訓(xùn)練集。

同步推出的SAM 3D包含兩個(gè)子模型：SAM 3D Objects實(shí)現(xiàn)單張自然圖像的3D形狀、紋理與物體布局重建，通過(guò)新訓(xùn)練方案標(biāo)注近百萬(wàn)張圖像，生成314萬(wàn)個(gè)網(wǎng)格模型，在人類(lèi)偏好測(cè)試中以五比一優(yōu)勢(shì)領(lǐng)先；SAM 3D Body則專(zhuān)注于復(fù)雜場(chǎng)景下的3D人體姿態(tài)估計(jì)，支持分割掩碼等交互式輸入。該模型訓(xùn)練數(shù)據(jù)集包含800萬(wàn)張圖像，涵蓋異常姿勢(shì)、遮擋及多人場(chǎng)景，在多個(gè)基準(zhǔn)測(cè)試中準(zhǔn)確性顯著提升。

實(shí)際應(yīng)用方面，SAM 3已拓展至科研領(lǐng)域。與Conservation X Labs合作構(gòu)建的SA-FARI數(shù)據(jù)集包含超1萬(wàn)個(gè)相機(jī)陷阱視頻，覆蓋100余物種，每幀動(dòng)物均標(biāo)注邊界框與分割掩碼；蒙特雷灣水族館研究所主導(dǎo)的FathomNet項(xiàng)目則開(kāi)放了水下圖像分割掩碼與實(shí)例分割基準(zhǔn)。這兩個(gè)數(shù)據(jù)集將助力全球AI社區(qū)開(kāi)發(fā)野生動(dòng)物監(jiān)測(cè)與海洋保護(hù)創(chuàng)新方案。

meta同步宣布，上述技術(shù)將率先應(yīng)用于Facebook Marketplace的“房間預(yù)覽”功能，幫助用戶可視化家居裝飾品的擺放效果。Segment Anything Playground平臺(tái)則提供零技術(shù)門(mén)檻的交互體驗(yàn)，用戶可上傳圖像視頻并嘗試不同提示方式，直觀感受AI分割技術(shù)的實(shí)際應(yīng)用場(chǎng)景。

12-16

尼康Z9相機(jī)Ver5.30固件更新：對(duì)焦視頻性能提升，新增UVC/UAC功能

12-16

技嘉AORUS RTX 5060 Ti AI BOX外置顯卡塢登場(chǎng) 雷電5接口配置豐富

12-16

TCL華星60.45億購(gòu)深圳華星半導(dǎo)體超一成股權(quán)，強(qiáng)化核心競(jìng)爭(zhēng)力提升盈利

12-16

Pop!_OS 24.04攜COSMIC桌面登場(chǎng)：性能躍升，打造個(gè)性化高效體驗(yàn)

性能方面，Pop!_OS 24.04搭載了Linux內(nèi)核6.17，這一版本在性能和響應(yīng)速度上都有顯著提升。新推出的混合圖形功能，更是讓Linux用戶在游戲體驗(yàn)上得到了質(zhì)的飛躍，應(yīng)用能夠自動(dòng)在適合的GPU上運(yùn)…

12-16

上海程控電話交換機(jī)維修全攻略：國(guó)威松下等品牌故障解決與升級(jí)方案

其實(shí)程控電話交換機(jī)壞了，它的維修價(jià)值還是相當(dāng)大的，可能只需要用幾百元或者是1000多些的費(fèi)用，就可以讓設(shè)備恢復(fù)正常工作，因?yàn)槎鄶?shù)的程控，它是模塊化的設(shè)計(jì)，配件是可以更換的，只是它的配置參數(shù)是在主板當(dāng)中，假如說(shuō)…

12-16

榮耀WIN系列本月震撼登場(chǎng)，極致性能+特色設(shè)計(jì)，電競(jìng)玩家新選擇

12-16

毅獅邁輪胎閃耀迪拜展：攜多元產(chǎn)品矩陣，深化中東非洲市場(chǎng)布局

12-16

大眾ID.Polo 2026年上市：空間升級(jí)續(xù)航450km 開(kāi)啟入門(mén)級(jí)純電新篇章

12-16

首席玩家NEO108三模機(jī)械鍵盤(pán)登場(chǎng)，全配列設(shè)計(jì)，紫星軸239元蔓越莓軸299元

【太平洋科技】12 月 15 日消息，首席玩家（1STPLAYER）于本月 12 日推出 NEO108 系列全配列三模，其中紫星軸售價(jià)239 元，蔓越莓軸售價(jià) 299 元。 NEO108 前置三模切換開(kāi)…

12-16

電腦壓縮文件誤刪別發(fā)愁！四大實(shí)用技巧助你輕松找回丟失數(shù)據(jù)

技巧2：回收站還原恢復(fù)電腦已刪除壓縮文件撤銷(xiāo)操作未能成功，如何恢復(fù)電腦的壓縮文件？ A：壓縮文件刪除后能否恢復(fù)及恢復(fù)時(shí)間，主要取決于刪除后的操作：若未覆蓋數(shù)據(jù)，通常可立即通過(guò)專(zhuān)業(yè)軟件恢復(fù)；一旦被新數(shù)據(jù)覆蓋，…

12-16

單模光纖跳線接口全解析：類(lèi)型特點(diǎn)、選擇建議與使用注意事項(xiàng)

主要用于長(zhǎng)距離、高速率的通信傳輸，如骨干網(wǎng)絡(luò)、數(shù)據(jù)中心等場(chǎng)景，其核心特點(diǎn)是采用9/125μm單模光纖，具備低衰減和優(yōu)異傳輸性能。兼容性：確保接口類(lèi)型與光模塊（如SFP、GBIC）匹配，例如SFP模塊需搭配L…

12-16

KHX50礦用避雷器：多重防護(hù)保障煤礦通信安全，模塊化設(shè)計(jì)降低維護(hù)成本

是專(zhuān)為煤礦井口及井下通信線路設(shè)計(jì)的防雷保護(hù)設(shè)備，具備高防護(hù)等級(jí)、多重保護(hù)機(jī)制、模塊化設(shè)計(jì)及合規(guī)性保障等核心優(yōu)勢(shì)，適用于煤礦等惡劣環(huán)境下的通信線路保護(hù)。 1.煤礦井口通信線路保護(hù)：安裝于通訊線路進(jìn)入設(shè)備箱的入…

12-16

蔚來(lái)ET5系列遠(yuǎn)空套裝限定版12月16日上市專(zhuān)屬設(shè)計(jì)配高階智駕續(xù)航達(dá)740km

12-16

?一行AI指令摧毀整臺(tái)Mac！Claude CLI工具誤刪用戶主目錄，開(kāi)發(fā)者多年心血瞬間清零

12-16

點(diǎn)擊查看更多 +

全站最新

飛豬升級(jí)評(píng)分體系并上線AI智能體助力度假商家降本增效創(chuàng)新供給

品牌借勢(shì)微博熱搜：遵循規(guī)則、把握原則，實(shí)現(xiàn)可持續(xù)社交影響力

福州新能源公交更新到位！多元化車(chē)型適配需求，人文關(guān)懷暖人心

嘉立創(chuàng)助力京東物流：以高效電子供應(yīng)鏈，開(kāi)啟智能硬件全球創(chuàng)新之路

法拉利Amalfi超跑：舒適性能兩手抓賽道套件成“棄子”

雷諾子品牌Mobilize關(guān)停，主打微型電動(dòng)車(chē)僅量產(chǎn)一年便退場(chǎng)

熱門(mén)內(nèi)容

本欄最新

毅獅邁輪胎閃耀迪拜展：攜多元產(chǎn)品矩陣，深化中東非洲市場(chǎng)布局

大眾ID.Polo 2026年上市：空間升級(jí)續(xù)航450km 開(kāi)啟入門(mén)級(jí)純電新篇章

蔚來(lái)ET5系列遠(yuǎn)空套裝限定版12月16日上市專(zhuān)屬設(shè)計(jì)配高階智駕續(xù)航達(dá)740km

經(jīng)典重現(xiàn)！路虎第一代衛(wèi)士復(fù)產(chǎn)訂購(gòu)開(kāi)啟，215萬(wàn)享專(zhuān)屬定制體驗(yàn)

二代哈弗H9穿越版上市，專(zhuān)業(yè)配置親民價(jià)，開(kāi)啟全民越野穿越新征程

全新寶馬X7 2027年發(fā)布：超感智控方向盤(pán)領(lǐng)銜科技豪華再升級(jí)

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類(lèi)資訊內(nèi)容，無(wú)障礙技術(shù)由太陽(yáng)灣捐增，為閱讀障礙用戶提供內(nèi)容聽(tīng)讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 聯(lián)系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

Meta發(fā)布SAM 3模型：突破標(biāo)簽限制，3D重建與多領(lǐng)域應(yīng)用再創(chuàng)新高

日本精品一区二区三区高清久久