大模型領(lǐng)域迎來新突破,知名獨(dú)角獸企業(yè)階躍星辰近日宣布開源其自主研發(fā)的GELab-Zero項(xiàng)目。這一創(chuàng)新成果首次將圖形用戶界面(GUI)智能體模型與完整的配套基礎(chǔ)設(shè)施同步開放,為開發(fā)者社區(qū)帶來重大利好,尤其為偏好自主搭建環(huán)境的“手搓黨”提供了一鍵部署的便捷方案。
核心亮點(diǎn)在于4B參數(shù)規(guī)模的GUI智能體模型,該模型在移動(dòng)端與桌面端的多項(xiàng)權(quán)威基準(zhǔn)測(cè)試中表現(xiàn)卓越,不僅刷新了同尺寸模型性能紀(jì)錄,更在ScreenSpot、OSWorld等國(guó)際公認(rèn)的評(píng)估體系中斬獲最先進(jìn)水平(SOTA)認(rèn)證。值得注意的是,其性能表現(xiàn)甚至超越了參數(shù)規(guī)模達(dá)32B的GUI-Owl等主流模型,在保持高精度的同時(shí)顯著降低了部署門檻。
技術(shù)團(tuán)隊(duì)同步開源了基于真實(shí)業(yè)務(wù)場(chǎng)景構(gòu)建的AndroidDaily評(píng)測(cè)標(biāo)準(zhǔn),該體系突破傳統(tǒng)學(xué)術(shù)評(píng)測(cè)框架,聚焦消費(fèi)級(jí)應(yīng)用的規(guī)模化落地需求。通過模擬日常高頻使用場(chǎng)景,為行業(yè)提供了更具實(shí)踐指導(dǎo)意義的評(píng)估維度。目前開發(fā)者可通過GitHub與HuggingFace兩大開源平臺(tái)獲取完整工具鏈,實(shí)現(xiàn)從模型訓(xùn)練到終端部署的全流程自主掌控。
在功能特性方面,GELab-Zero展現(xiàn)出強(qiáng)大的工程化能力。其輕量化設(shè)計(jì)支持4B模型在消費(fèi)級(jí)硬件上流暢運(yùn)行,既保證了低延遲響應(yīng)又確保用戶數(shù)據(jù)隱私安全。系統(tǒng)內(nèi)置的智能環(huán)境適配模塊可自動(dòng)處理多終端依賴配置,支持跨設(shè)備任務(wù)分發(fā)與交互軌跡記錄,形成可復(fù)現(xiàn)的操作閉環(huán)。更創(chuàng)新性地引入多模態(tài)智能體協(xié)作框架,涵蓋ReAct閉環(huán)推理、多智能體協(xié)同作業(yè)及定時(shí)任務(wù)調(diào)度等高級(jí)工作模式。
實(shí)際應(yīng)用場(chǎng)景測(cè)試顯示,該系統(tǒng)能精準(zhǔn)執(zhí)行復(fù)雜組合指令。在跨品類采購(gòu)任務(wù)中,可自動(dòng)處理不同商品的規(guī)格匹配與數(shù)量計(jì)算;面對(duì)“適合親子活動(dòng)的經(jīng)典電影推薦”等主觀性需求時(shí),能通過語義理解建立動(dòng)態(tài)評(píng)估標(biāo)準(zhǔn),生成符合用戶偏好的執(zhí)行方案。這種類人化的決策能力,標(biāo)志著GUI智能體從單一指令響應(yīng)向自主策略規(guī)劃的跨越。
研發(fā)團(tuán)隊(duì)透露,項(xiàng)目初衷源于對(duì)移動(dòng)生態(tài)碎片化難題的深度洞察。當(dāng)前不同品牌設(shè)備的系統(tǒng)差異導(dǎo)致智能體部署面臨ADB連接、權(quán)限配置等工程障礙,開發(fā)者需耗費(fèi)大量精力處理基礎(chǔ)設(shè)施問題。GELab-Zero通過標(biāo)準(zhǔn)化接口設(shè)計(jì)與自動(dòng)化運(yùn)維模塊,將開發(fā)者從重復(fù)性工程工作中解放,使其能專注于核心算法創(chuàng)新。
此前該團(tuán)隊(duì)展示的AI手機(jī)解決方案已展現(xiàn)技術(shù)潛力,接入系統(tǒng)的設(shè)備可自主完成追星打卡、外賣訂購(gòu)、醫(yī)療預(yù)約等30余類生活服務(wù)。此次開源的GELab-Zero進(jìn)一步拓展了應(yīng)用邊界,通過提供完整的工具鏈與開發(fā)范式,加速推動(dòng)GUI智能體從實(shí)驗(yàn)室走向規(guī)模化商業(yè)應(yīng)用,為智能終端交互范式革新奠定技術(shù)基礎(chǔ)。










