馬斯克旗下人工智能公司xAI近日推出全新大模型Grok 4.1,以"雙商在線"為賣點,直接對標尚未正式發(fā)布的GPT-5.1。這款模型分為Thinking(推理版)和標準版兩個版本,現(xiàn)已在Grok官網(wǎng)、X平臺及移動端應用全面開放免費體驗。
在權(quán)威評測平臺LMArena的最新榜單中,Grok 4.1 Thinking以1483分登頂全球大模型排行榜,較第二名Gemini 2.5 Pro高出31分。其標準版同樣表現(xiàn)強勁,直接占據(jù)榜單次席。更引人注目的是情商測試EQ-Bench3的結(jié)果:Thinking版以1586分刷新紀錄,標準版緊隨其后,國產(chǎn)模型Kimi K2位列第三。
實測體驗顯示,新模型在交互方式上發(fā)生顯著變化。相比前代產(chǎn)品,Grok 4.1展現(xiàn)出更強的共情能力,回復結(jié)尾會主動添加愛心符號,被用戶形容為"更有耐心的傾聽者"。其創(chuàng)意寫作能力提升尤為突出,評分較前代激增600分,文本生成更具畫面感和敘事性。同時,模型幻覺率從12.09%大幅降至4.22%,信息準確性顯著改善。
技術(shù)突破源于強化學習框架的全面升級。xAI后訓練負責人Dustin Tran透露,團隊在支撐前代模型的基礎(chǔ)設(shè)施上,通過優(yōu)化模型風格特征和個性表達,開發(fā)出利用智能體推理模型作為獎勵機制的新方法。這種自主評估體系使大規(guī)模迭代響應成為可能,強化學習規(guī)模較前代擴大10倍。
團隊構(gòu)成成為另一關(guān)注焦點。近期流傳的xAI合影顯示,核心研發(fā)團隊以亞裔面孔為主,有消息稱原Grok團隊白人成員已全部離職。這種人員調(diào)整被外界解讀為馬斯克的人才戰(zhàn)略轉(zhuǎn)型,但公司尚未對此作出正式回應。
關(guān)于備受期待的Grok 5,馬斯克在最新訪談中透露,這款預計參數(shù)規(guī)模達6萬億的模型將推遲至明年發(fā)布。他解釋稱,作為邁向通用人工智能的關(guān)鍵里程碑,Grok 5需要前所未有的計算資源支持,目前仍在進行極其嚴格的測試驗證。這與此前報道中提到的資源限制和測試難度問題形成呼應。
行業(yè)觀察人士指出,Grok 4.1的發(fā)布既是技術(shù)迭代的成果展示,也暗含馬斯克構(gòu)建AI生態(tài)的深層布局。不過隨著谷歌Gemini 3.0等競品即將入場,大模型領(lǐng)域的競爭格局仍存在變數(shù)。這場由科技巨頭主導的AI競賽,正在持續(xù)改寫人工智能技術(shù)的發(fā)展軌跡。










