在人工智能領(lǐng)域,國產(chǎn)大模型正以驚人的速度崛起。近日,智譜推出的GLM-4.7模型引發(fā)廣泛關(guān)注,這款在IPO前夕亮相的模型,憑借多項技術(shù)突破,成為全球開源模型中的佼佼者。
從專業(yè)測評數(shù)據(jù)來看,GLM-4.7在多個維度展現(xiàn)出強勁實力。在Code Arena面向全球開發(fā)者的編碼盲測中,該模型在Web開發(fā)方向排名第六,超越GPT-5.2與Claude Sonnet 4.5,成為全球排名最高的開源模型,同時穩(wěn)居國產(chǎn)模型榜首。在代碼能力方面,SWE-bench?Verified測試中取得73.8%的成績,LiveCodeBench?V6測試中達到84.9%,整體水平與Claude Sonnet 4.5持平,處于開源模型第一梯隊。復(fù)雜推理任務(wù)中,HLE成績在工具輔助條件下提升至42.8%,較GLM?4.6提升超12個百分點,甚至超過GPT?5.1 High。工具調(diào)用能力同樣出色,在τ2?Bench中取得87.4%的成績,BrowseComp在開啟上下文管理后提升至67.5%,在多輪網(wǎng)頁任務(wù)和交互式工具調(diào)用場景中表現(xiàn)穩(wěn)定。
這些亮眼成績的背后,是模型內(nèi)部思考機制的重大調(diào)整。GLM?4.7在“交錯思考”基礎(chǔ)上,引入保留式思考與輪級思考控制機制。模型在每次生成和工具調(diào)用前會先進行推理,并在多輪任務(wù)中自動保留已有思考結(jié)果,避免重復(fù)推導(dǎo)。開發(fā)者還可按輪次決定是否啟用推理過程,在簡單請求中降低時延,在復(fù)雜任務(wù)中提升穩(wěn)定性。這種設(shè)計增強了長任務(wù)執(zhí)行的一致性和可控性,為模型在代碼智能體、終端任務(wù)和工具協(xié)同類基準上的整體提升提供了支撐。模型還針對前端美學(xué)、長文本穩(wěn)定性、網(wǎng)頁生成結(jié)構(gòu)等細節(jié)進行了優(yōu)化。
為了驗證GLM?4.7在實際開發(fā)任務(wù)中的表現(xiàn),智譜對100個真實編程任務(wù)進行了對比測試,涵蓋前端開發(fā)、后端邏輯和指令遵循三個核心方向。結(jié)果顯示,前端任務(wù)中,GLM?4.7相較4.6版本勝率提升至64.6%;指令遵循場景中達到58.3%;后端方向勝率穩(wěn)定在46.7%。在多技能聯(lián)動能力方面,GLM-4.7在Z.ai上線了全棧技能環(huán)境,接入全新Skills模塊,支持調(diào)用ASR語音識別、TTS語音合成、GLM?4.6V視覺模型等多個模塊進行統(tǒng)一調(diào)度,實現(xiàn)了多模態(tài)任務(wù)中的路徑規(guī)劃和動作執(zhí)行,打通了工具之間的“調(diào)度邏輯”。
在實際互動任務(wù)測試中,GLM-4.7的表現(xiàn)同樣令人驚艷。在3D控制任務(wù)中,模型輸出可直接運行的HTML代碼,構(gòu)建出包含5000多個粒子的立體圣誕樹,頂部帶有輝光效果的星星。移動鼠標時,粒子會產(chǎn)生斥力波紋,形成流動的視覺效果。系統(tǒng)還能調(diào)用攝像頭識別用戶手勢,張開手掌時圣誕樹炸開變?yōu)檎掌瑝Γ笥乙苿邮终普掌瑝D(zhuǎn),握拳時所有元素收攏歸位,形成完整動畫。代碼中還集成了性能優(yōu)化機制,確保頁面在不依賴構(gòu)建工具的情況下保持高幀率和流暢度。在UI生成任務(wù)中,輸入“1:1復(fù)刻iOS系統(tǒng)”提示詞后,模型生成了模仿iOS的主頁面,Safari、Siri等圖標均可點擊,日歷、天氣等功能頁可交互,計算器能進行基礎(chǔ)運算,圖標風(fēng)格和顏色搭配也具備基本審美。在前端代碼實現(xiàn)任務(wù)中,模型生成了完整的雙人格斗游戲界面,風(fēng)格高度還原Switch主機Joy-Con手柄配色和布局,左側(cè)藍色手柄,右側(cè)紅色手柄,中間是游戲主屏幕。游戲中有兩個火柴人角色,頭頂有動態(tài)血條,UI顯示當(dāng)前波次與敵人數(shù)量等信息,操作體驗上,左右玩家可通過鍵盤不同按鍵控制角色移動、攻擊和釋放技能,整體界面結(jié)構(gòu)、角色邏輯和按鍵響應(yīng)完整,具備真實游戲框架感,且內(nèi)置節(jié)奏感強的格斗BGM。
GLM-4.7的開源代碼在全球社區(qū)中已被下載超6000萬次,付費API使用量長期居于OpenRouter全球前十,逐步進入開發(fā)者的實際工具列表。在智譜即將登陸港交所的背景下,GLM-4.7的上線成為國產(chǎn)大模型企業(yè)從科研模型、開源生態(tài)向“真實使用”與“市場驗證”過渡的一個縮影,標志著開源國產(chǎn)模型正從“對標國際”邁向“領(lǐng)跑、實用”。











