近日,全球知名語言模型評估平臺LMArena公布了最新一期文本能力榜單,百度自主研發的文心新模型ERNIE-5.0-Preview-1203以1451分的成績躍居中國區榜首。該模型在創意寫作、復雜指令處理等高難度任務中展現出顯著優勢,超越了包括Claude-Opus-4-1、GPT-5.2在內的多款國際主流模型。
LMArena作為獨立第三方評估機構,其測試體系涵蓋文本理解、邏輯推理、知識問答、代碼生成及創意寫作五大核心維度。平臺通過標準化測試流程,對全球范圍內主流語言模型進行量化評分與橫向對比,其排名結果被業界視為衡量模型綜合實力的重要參考依據。
此次登頂的ERNIE-5.0-Preview-1203在測試中表現出色,尤其在需要創造性思維的場景中展現出獨特優勢。評估數據顯示,該模型在處理開放式問題、生成多樣化文本內容以及遵循復雜指令等任務中,得分顯著高于同期參評的其他模型。技術團隊透露,這一突破得益于模型架構的優化與創新訓練策略的應用。
值得注意的是,本次榜單中中國科技企業的表現引人注目。除百度外,Qwen3-Max-Preview等國產模型也躋身前列,顯示出中國在人工智能領域的技術積累正在加速轉化為實際應用能力。行業分析師指出,隨著語言模型競爭進入深水區,垂直場景下的精細化能力將成為下一階段比拼的關鍵。











