在2025百度世界大會的現場,百度公司重磅推出新一代原生全模態大模型——文心大模型5.0。這款采用統一自回歸架構的模型,通過原生全模態建模技術實現了文本、圖像、音頻、視頻等多模態數據的深度融合,參數量達到2.4萬億級別,標志著我國人工智能技術邁入全新發展階段。
據技術團隊介紹,文心5.0突破傳統多模態模型后期融合的技術路徑,從訓練階段便實現語言、視覺、聽覺等多維度數據的原生融合。這種創新架構使得模型在理解復雜信息時,能夠同步調動不同模態的特征進行協同優化,最終形成統一的多模態表征體系。在權威基準測試中,該模型的語言理解能力與Gemini-2.5-Pro、GPT-5-High等國際頂尖模型持平,圖像視頻生成質量達到垂直領域專業模型水準。
百度首席技術官王海峰在技術解讀環節指出,原生全模態架構的優勢在于實現理解與生成的深度耦合。通過統一的自回歸機制,模型不僅能夠精準解析多模態輸入,更能生成符合邏輯的多模態輸出,這種技術突破為智能體規劃、工具調用等復雜應用場景提供了堅實基礎。
在應用層面,文心5.0展現出全方位的能力提升。測試數據顯示,模型在指令遵循準確率、創意寫作質量、事實核查精度等40余項核心指標上均有顯著突破。特別是在跨模態任務處理中,其智能體規劃能力較前代提升37%,工具調用成功率達到92%,展現出強大的環境適應與問題解決能力。
百度創始人李彥宏在主題演講中強調,智能技術的進化正在突破傳統邊界。他指出:"當前大模型的發展已進入智能躍遷期,模型不僅具備更長的思考鏈,更能通過自我迭代實現能力進化。這種持續突破的創新能力,正是構建技術壁壘的核心要素。"
在生態建設方面,百度同步推出文心大模型5.0 Preview版本。個人用戶可通過文心App直接體驗最新功能,開發者和企業客戶則能借助千帆大模型平臺調用API服務。值得關注的是,在11月8日發布的LMArena大模型競技場排名中,文心ERNIE-5.0-Preview-1022在文本任務評測中取得全球并列第二、國內第一的優異成績,尤其在復雜邏輯推理和創意內容生成領域表現突出。
行業分析人士認為,文心5.0的推出標志著我國在多模態大模型領域實現關鍵技術突破。其原生全模態架構不僅解決了傳統模型的信息割裂問題,更為智能體、數字人等前沿應用提供了更強大的技術支撐,有望推動人工智能技術向通用智能方向加速演進。







