近日,智譜科技宣布將其核心AI智能體模型AutoGLM正式開源,這一舉措在人工智能領域引發廣泛討論。作為一款跨端通用智能體,AutoGLM能夠通過自然語言指令自主操作手機、電腦等設備,實現"一句話完成復雜任務"的交互體驗。該模型首次亮相于111天前,經過持續迭代,現已具備穩定處理外賣訂購、機票預訂、社交互動等數十步流程的能力,覆蓋50余個高頻中文應用的核心場景。
AutoGLM的核心突破在于其"Phone Use"能力框架,可精準模擬人類點擊、滑動、輸入等操作。在跨端協同方面,該模型支持手機與電腦的聯動操作——用戶可通過手機發送指令,讓電腦自動生成PPT或整理數據,所有任務均在云端虛擬環境中運行,避免占用本地設備資源。這種設計既提升了執行效率,又保障了用戶設備的使用流暢性。
2025年8月升級至2.0版本后,AutoGLM明確"執行型助手"定位,突破傳統AI助手僅提供對話或信息查詢的局限。在辦公場景中,該模型可自主完成從資料檢索到視頻、PPT生成的全流程;在生活服務領域,則能實現跨應用聯動預訂。不過,初期版本因第三方應用適配問題、授權流程繁瑣及語義理解偏差等因素,未能實現預期的C端傳播效果。
此次開源包含三大核心價值:其一,通過開放技術底座打破AI手機能力壟斷,防止行業生態被少數企業控制;其二,采用MIT和Apache-2.0雙許可證協議,確保用戶數據與控制權完全歸屬使用方,支持私有化部署;其三,共享32個月的技術積累,提供訓練好的核心模型、能力框架及50余個高頻應用的開發文檔,顯著降低Agent開發門檻。據技術文檔披露,開源內容已形成完整的技術棧,開發者可基于現有框架快速構建定制化解決方案。
行業分析指出,AutoGLM的開源戰略具有深遠影響。通過將"AI使用手機"這一核心能力轉化為公共基礎設施,該模型為開發者提供了標準化開發環境,類似Android系統對移動應用生態的塑造作用。這種模式不僅避免了技術壟斷風險,更通過降低開發成本催生多樣化創新應用。特別是在涉及支付、社交等敏感領域,私有化部署方案有效解決了用戶信任問題,技術團隊明確表示"拒絕將關鍵能力集中于單一主體"。
當前AI智能體領域正形成兩條技術路線:以AutoGLM為代表的"云端智能體"范式,通過虛擬設備隔離執行環境,保障用戶本地設備性能;以某競品為代表的"終端具身智能"范式,則直接在物理設備上模擬操作,將AI能力深度集成至硬件層。后者雖實現多任務并行,但因挑戰現有超級應用生態壁壘,已引發部分平臺的限制措施。兩種路徑的競爭,實質是軟件生態與硬件整合的權力博弈。
智譜的開源策略包含雙重考量:技術層面,通過封裝操作執行能力為API接口,支持開發者靈活調用;生態層面,構建開放協作的技術社區,吸引硬件廠商、應用開發者共同完善標準。這種模式與某競品通過專屬硬件搶占終端入口的策略形成鮮明對比,標志著AI智能體領域正式進入基礎設施競爭階段。隨著更多參與者入局,這場關于技術標準與生態主導權的競爭將持續重塑行業格局。











