滾動資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

GAIR 2025聚焦具身智能：數(shù)據(jù)瓶頸與AIRSPEED平臺破局之路

時間：2025-12-19 09:55:16 來源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評論無障礙通道

在近期落幕的一場全球人工智能與機(jī)器人領(lǐng)域的重要會議上，具身智能成為行業(yè)關(guān)注的焦點(diǎn)。這一連接虛擬模型與物理世界的關(guān)鍵賽道，正吸引著眾多企業(yè)和科研力量投身其中。深圳極數(shù)迭代科技創(chuàng)始人佟顯喬博士在會上圍繞具身智能數(shù)據(jù)領(lǐng)域進(jìn)行了深度分享，為行業(yè)發(fā)展提供了新的思路。

當(dāng)前，語言大模型憑借海量數(shù)據(jù)實(shí)現(xiàn)了爆發(fā)式增長，而具身智能與機(jī)器人領(lǐng)域卻面臨著數(shù)據(jù)供給的巨大缺口。現(xiàn)有的數(shù)據(jù)集規(guī)模僅在數(shù)千至十幾萬小時，與語言模型的海量數(shù)據(jù)儲備差距明顯。數(shù)據(jù)作為具身智能發(fā)展的核心基石，其稀缺性、高成本與碎片化問題，嚴(yán)重制約了機(jī)器人泛化能力的提升。佟顯喬博士認(rèn)為，盡管目前具身數(shù)據(jù)量較少，但無論未來具身模型如何發(fā)展、本體怎樣迭代，數(shù)據(jù)始終是基石，未來幾年數(shù)據(jù)體量將大幅增長，具身數(shù)據(jù)服務(wù)有望成為機(jī)器人領(lǐng)域確定性的數(shù)據(jù)服務(wù)機(jī)會。

具身智能的數(shù)據(jù)瓶頸主要體現(xiàn)在三個方面。從泛化能力來看，類比 Scaling Law，目前機(jī)器人的泛化能力遠(yuǎn)不足，模仿學(xué)習(xí)需適配不同本體、數(shù)據(jù)和場景，但現(xiàn)有的數(shù)據(jù)采集和空間泛化能力嚴(yán)重不足。研究表明，泛化能力與數(shù)據(jù)數(shù)量呈冪律關(guān)系，現(xiàn)有數(shù)據(jù)量難以讓機(jī)器人達(dá)到較好的任務(wù)成功率，且在機(jī)器人領(lǐng)域 Scaling Law 依然存在，更多數(shù)據(jù)大概率能帶來更好效果，所以解決數(shù)據(jù)需求瓶頸迫在眉睫。從技術(shù)路線角度，無論是“小腦加大腦”的分層路線，還是端到端的數(shù)據(jù)路線，對具身數(shù)據(jù)的需求都十分龐大。“大腦”負(fù)責(zé)理解物理世界常識和人類指令、拆分復(fù)雜任務(wù)；“小腦”或技能層面涉及抓取、按壓等動作，需要人類示教數(shù)據(jù)和機(jī)器人感知數(shù)據(jù)，且要覆蓋不同場景，很多數(shù)據(jù)還需人類標(biāo)注；端到端訓(xùn)練是大腦與小腦的整合，不同流派方法不同，但都需要不同數(shù)據(jù)、人的參與以及不同場景和任務(wù)的泛化。從定性分析，滿足需求需大腦和小腦數(shù)據(jù)乘以不同機(jī)器人類別，而跨本體數(shù)據(jù)復(fù)用難，放大人類標(biāo)注演示或做更多泛化任務(wù)場景，成本都很高。因此，成本飛漲、模型跨本體能力弱導(dǎo)致數(shù)據(jù)孤島且標(biāo)準(zhǔn)難統(tǒng)一、難以評估數(shù)據(jù)實(shí)際能力，成為具身智能數(shù)據(jù)面臨的主要瓶頸。

具身智能數(shù)據(jù)本身是一項(xiàng)工程化工作，涵蓋從底層采集設(shè)計、數(shù)據(jù)標(biāo)準(zhǔn)確立，到真實(shí)環(huán)境和仿真環(huán)境下的采集部署等一系列環(huán)節(jié)。目前數(shù)據(jù)集種類多樣，包括操作類、移動類、邏輯語義類、導(dǎo)航類等，但各做各的，尚未出現(xiàn)能將所有數(shù)據(jù)聯(lián)系起來的通用模型。在數(shù)據(jù)采集方面，真機(jī)采集方式眾多，如遙操、示教、用末端執(zhí)行器動捕人類視覺數(shù)據(jù)學(xué)習(xí)、遙操同構(gòu)的遙操視學(xué)光冠操作等，不同方式在不同維度各有優(yōu)劣，不同團(tuán)隊(duì)和公司都在探索。仿真數(shù)據(jù)在軌跡合成、姿態(tài)合成、預(yù)測生成、決策生成等方面也有不同探索，部分團(tuán)隊(duì)認(rèn)為仿真數(shù)據(jù)可能比真機(jī)數(shù)據(jù)效果更好。

針對這些問題，目前沒有通用解法。需針對不同場景做系統(tǒng)設(shè)計，在高效性和可靠性間找到平衡，確立數(shù)據(jù)標(biāo)準(zhǔn)，降低真機(jī)、真實(shí)世界和仿真數(shù)據(jù)成本，提升效率，優(yōu)化不同機(jī)器人和場景的部署。對于數(shù)據(jù)孤島問題，由于不同數(shù)據(jù)在有效性和通用性上存在差異，如遙操固定真機(jī)數(shù)據(jù)質(zhì)量高但通用性差，人類視頻數(shù)據(jù)量大但訓(xùn)練模型效果差，目前的解決方案是應(yīng)收盡收。

深圳極數(shù)迭代科技有限公司與深圳市人工智能與機(jī)器人研究院合作，推出了具身智能數(shù)據(jù)平臺 AIRSPEED。該平臺致力于兼容不同機(jī)器人本體和遙操設(shè)備，通過不同的機(jī)器人接口、遙操接口、仿真接口，實(shí)現(xiàn)真機(jī)、仿真以及不同機(jī)器人之間的良好兼容性，憑借高軟硬件和技術(shù)兼容性實(shí)現(xiàn)生產(chǎn)柔性化，高效生產(chǎn)數(shù)據(jù)。平臺架構(gòu)盡量減少用戶編程需求，用戶配置好接口后，通過一個接口就能實(shí)現(xiàn)全流程順暢的數(shù)據(jù)生產(chǎn)，旨在成為第三方平臺，減少客戶適配不同機(jī)器人和數(shù)據(jù)的復(fù)雜工作。

該平臺不僅是一個技術(shù)解決方案，更是一個管理解決方案平臺。當(dāng)數(shù)據(jù)達(dá)到一定規(guī)模后，需要管理大規(guī)模采集員、標(biāo)注員，進(jìn)行任務(wù)調(diào)度、數(shù)據(jù)處理和標(biāo)注等系統(tǒng)工程，這些都能通過平臺高效管理。平臺針對真機(jī)數(shù)據(jù)提出“萬物皆可達(dá)”，適配不同采集方案，從遙操到示教類，分三個階段兼容，提供統(tǒng)一接口；針對仿真數(shù)據(jù)提出“萬物皆可生”，從軌跡合成、資產(chǎn)合成、決策生成和預(yù)測生成四個維度，統(tǒng)一管理不同仿真平臺和資產(chǎn)。平臺引入 AI Agent 概念，減輕任務(wù)管理員等工作負(fù)擔(dān)，加入大模型用于自動標(biāo)注、自動資源管理和訓(xùn)練模型評測，旨在打造具身智能數(shù)據(jù)工具鏈，助力高效訓(xùn)練模型和快速部署。

目前，該平臺在真機(jī)和仿真方面都具備了快速迭代模型的能力，在真實(shí)世界數(shù)據(jù)集構(gòu)建上實(shí)現(xiàn)了 30 多倍加速，在仿真方面有 3.5 倍加速，期望以飛輪效應(yīng)不斷提升模型迭代效率。其數(shù)據(jù)管理平臺以數(shù)據(jù)集交付為中心，分開管理任務(wù)、設(shè)備、標(biāo)注、用戶，不同客戶可直接在平臺上進(jìn)行任務(wù)管理和生成，支持多種遙操作、動捕和 UMI 等設(shè)備接入，實(shí)現(xiàn)統(tǒng)一數(shù)據(jù)管理。目前，平臺已與遙操設(shè)備合作伙伴、數(shù)據(jù)采集盒子供應(yīng)商以及不同機(jī)器人廠商開展合作。公司專注于機(jī)器人數(shù)據(jù)、具身數(shù)據(jù)探索，以 AIRSPEED 平臺為核心產(chǎn)品提高數(shù)據(jù)效率，還著有相關(guān)書籍《具身智能數(shù)據(jù)工程》。用戶使用平臺時，可以數(shù)據(jù)集為中心建立不同數(shù)據(jù)集，選擇本體和遙操設(shè)備，批量建立任務(wù)后發(fā)給采集員采集數(shù)據(jù)，采集完上傳平臺由標(biāo)注員標(biāo)注，審核員審核后導(dǎo)出標(biāo)準(zhǔn)數(shù)據(jù)集用于訓(xùn)練模型，平臺支持多種機(jī)器人和遙操設(shè)備，也支持在仿真環(huán)境進(jìn)行遙操和數(shù)據(jù)采集。

12-19

江蘇昆山盛啟光合組織2025人工智能創(chuàng)新大會共探AI計算新成果

12-19

OpenAI推出GPT-5.2-Codex：軟件工程與網(wǎng)絡(luò)安全能力再上新臺階

12-19

OpenAI發(fā)布GPT-5.2-Codex：智能體編程再升級，助力開發(fā)者高效編碼

該模型在 GPT-5.2 的通用智能基礎(chǔ)上，融合了 GPT-5.1-Codex-Max的終端操作能力，其核心突破在于引入了“上下文壓縮”技術(shù)，讓其在處理代碼重構(gòu)、遷移等長程任務(wù)時效率倍增。針對開發(fā)者的實(shí)…

12-19

火山引擎：AI加速落地行業(yè)，Agent技術(shù)引領(lǐng)企業(yè)生產(chǎn)力新變革

17天后，在FORCE原動力大會上，火山引擎發(fā)布了豆包大模型1.8版本，而且還有配備了Agent的各種能力。圍繞Agent開發(fā)、部署、運(yùn)維、調(diào)優(yōu)、管控，火山引擎今天也發(fā)布了自己的技術(shù)體系，AI Agent平…

12-19

20萬級混動方盒子之爭：深藍(lán)G318與捷途旅行者C-DM誰更勝一籌？

12-19

歐拉5純電緊湊型SUV上市！五款配置豐富，續(xù)航智能配置亮點(diǎn)多

12-19

長城歐拉5上市，限時換新價9.18萬起，顏值智能安全皆在線成出行優(yōu)選

12-19

逐際動力TRON 2具身機(jī)器人亮相：一機(jī)三形態(tài)，適配多場景科研應(yīng)用

同時，TRON2集成原生的數(shù)據(jù)采集與管理平臺，覆蓋采集、訓(xùn)練、驗(yàn)證到真機(jī)部署的完整閉環(huán)，加速科研進(jìn)程。得益于逐際動力在雙足機(jī)器人運(yùn)動控制與硬件領(lǐng)域的深厚積累，TRON2全地形移動能力全面提升，適應(yīng)更高難度的移…

12-19

全球最小全自主機(jī)器人問世：尺寸如鹽粒成本低至1美分可感知通信

報道還提到，它的機(jī)載計算機(jī)速度不到現(xiàn)代筆記本電腦的千分之一，但足以讓它對環(huán)境中檢測到的變化，如溫度，并做出反應(yīng)。至關(guān)重要的是，這個機(jī)器人仍然可以和人類操作者進(jìn)行通信，“我們可以用筆記本電腦向它發(fā)送信息，告訴…

12-19

火山引擎：AI加速落地行業(yè)，Agent技術(shù)引領(lǐng)企業(yè)生產(chǎn)力新變革

17天后，在FORCE原動力大會上，火山引擎發(fā)布了豆包大模型1.8版本，而且還有配備了Agent的各種能力。圍繞Agent開發(fā)、部署、運(yùn)維、調(diào)優(yōu)、管控，火山引擎今天也發(fā)布了自己的技術(shù)體系，AI Agent平…

12-19

全球首條！人形具身智能機(jī)器人“小墨”在寧德時代產(chǎn)線規(guī)模化應(yīng)用

【太平洋科技】12 月 18 日消息，據(jù)《科創(chuàng)板日報》報道，全球首條實(shí)現(xiàn)人形具身智能機(jī)器人規(guī)模化落地的新能源動力電池 PACK生產(chǎn)線，近日已在寧德時代中州基地正式投入運(yùn)行。此次批量上崗的人形機(jī)器人名為…

12-19

全球最小全自主機(jī)器人問世：僅鹽粒大小成本1美分可移動通信

報道還提到，它的機(jī)載計算機(jī)速度不到現(xiàn)代筆記本電腦的千分之一，但足以讓它對環(huán)境中檢測到的變化，如溫度，并做出反應(yīng)。至關(guān)重要的是，這個機(jī)器人仍然可以和人類操作者進(jìn)行通信，“我們可以用筆記本電腦向它發(fā)送信息，告訴…

12-19

高通提前完成對Alphawave Semi收購，完善AI產(chǎn)品組合

12-19

火山引擎發(fā)布 AI 節(jié)省計劃，豆包大模型最高降價47%

12-19

點(diǎn)擊查看更多 +

全站最新

20萬級混動方盒子之爭：深藍(lán)G318與捷途旅行者C-DM誰更勝一籌？

紅旗HS6 PHEV來襲！17萬級中大型插混SUV，豪華科技加速全都有

歐拉5純電緊湊型SUV上市！五款配置豐富，續(xù)航智能配置亮點(diǎn)多

BBA發(fā)力新能源賽道！國產(chǎn)奔馳GLE、奧迪A6L e-tron、寶馬iX3明年登場

10-15萬純電家轎之爭：東風(fēng)日產(chǎn)N7和深藍(lán)L06誰更契合你的需求？

奔馳烏尼莫克U4030官圖亮相，7.7T柴油引擎加持，豪華越野新體驗(yàn)

熱門內(nèi)容

本欄最新

長城歐拉5上市，限時換新價9.18萬起，顏值智能安全皆在線成出行優(yōu)選

逐際動力TRON 2具身機(jī)器人亮相：一機(jī)三形態(tài)，適配多場景科研應(yīng)用

盈峰環(huán)境：以技術(shù)創(chuàng)新領(lǐng)航新能源環(huán)衛(wèi)賽道，打造全球環(huán)境治理“中國方案”

光梭未來獲鉅輪獎：以技術(shù)出海破局引領(lǐng)中國商用車邁向全球價值鏈高端

逐際動力TRON 2具身機(jī)器人來襲！一機(jī)三形態(tài)，解鎖全場景科研新可能

吉利銀河A7上市110天第70000輛下線賦能“百萬銀河”邁向全球化新程

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

GAIR 2025聚焦具身智能：數(shù)據(jù)瓶頸與AIRSPEED平臺破局之路

日本精品一区二区三区高清久久