英偉達近日正式推出開源模型系列Nemotron 3,涵蓋Nano、Super和Ultra三種規格,旨在為AI智能體應用提供兼具高效性與精準度的解決方案。該系列模型通過引入混合潛在專家(MoE)架構,支持開發者構建大規模、可靠的多智能體系統,應對當前AI開發中通信效率、上下文一致性及推理成本等核心挑戰。
據官方介紹,Nemotron 3的MoE架構通過動態激活不同參數子集,顯著提升了模型在復雜任務中的表現。例如,在多智能體協作場景中,該架構可減少30%的通信開銷,同時將上下文漂移問題降低45%。模型透明度設計允許開發者追蹤決策路徑,增強對自動化流程的信任度,這一特性在制造業、網絡安全等關鍵領域尤為重要。
目前,安永、思科、Oracle Cloud Infrastructure等十余家企業已將Nemotron 3集成至AI工作流。制造業客戶利用其處理供應鏈優化任務,網絡安全團隊則通過模型實時分析威脅模式。初創公司反饋顯示,該系列模型使原型開發周期縮短60%,企業級部署成本降低50%以上。
具體規格方面,Nemotron 3 Nano作為輕量級模型,參數規模達300億,每次激活最多30億參數,專為軟件調試、內容摘要等高效任務設計。其100萬token的上下文窗口支持長時間多步驟操作,相比前代模型,token處理吞吐量提升4倍,推理成本降低60%。該模型已率先在Hugging Face平臺開放下載。
更高規格的Super與Ultra模型分別擁有約1000億和5000億參數,支持每token最多激活100億和500億參數。Super模型側重多智能體推理準確性,Ultra則定位復雜AI應用場景,如跨模態內容生成與實時決策系統。這兩款模型預計于2026年上半年陸續發布,開發者可提前通過官方渠道申請測試權限。
行業分析指出,Nemotron 3的開源策略將加速AI智能體生態發展。其模塊化設計允許企業根據需求靈活組合模型能力,例如在醫療領域結合Nano的快速響應與Ultra的深度分析能力。隨著多智能體系統從實驗階段轉向規模化應用,該系列模型或成為推動AI產業升級的關鍵基礎設施。











