在今日舉辦的2025小米人車家全生態合作伙伴大會上,Xiaomi MiMo大模型負責人羅福莉首次公開亮相,介紹了小米最新發布的開源模型技術成果。這款名為Xiaomi MiMo-V2-Flash的MoE架構模型,憑借其卓越的推理性能引發行業關注。
該模型采用獨特的三層MTP推理加速架構,通過并行Token驗證機制實現推理效率突破。技術團隊披露的數據顯示,其推理速度較傳統模型提升2.0至2.6倍,在保持3090億總參數規模的同時,僅需激活150億參數即可運行。這種設計既保證了模型能力,又顯著降低了計算資源消耗。
在專業評測中,MiMo-V2-Flash展現出強勁實力。該模型在代碼生成和智能體任務基準測試中位列全球開源模型第二梯隊,初步具備世界模擬能力。演示案例顯示,其可通過HTML代碼構建簡易操作系統,模擬太陽系運行軌跡,甚至生成交互式圣誕樹動畫,這些應用場景驗證了模型的多模態理解能力。
羅福莉在技術分享中強調,新一代智能體系統不應局限于語言交互層面。她提出,真正的智能體需要構建對物理世界的認知框架,形成與環境動態交互的感知-決策-執行閉環。這種設計理念突破了傳統語言模型的模擬器定位,指向具備自主進化能力的通用智能體系統。
據技術白皮書披露,MiMo-V2-Flash的優化方向聚焦于實時響應場景。其架構設計特別考慮了邊緣計算設備部署需求,通過參數壓縮和計算分流技術,使模型能在移動終端實現本地化運行。這項突破為智能家居、自動駕駛等小米核心業務場景提供了新的技術支撐。
行業分析師指出,小米此次發布的開源模型在工程實現層面具有創新價值。其通過架構優化實現性能躍升的技術路徑,為AI大模型落地消費電子領域提供了可復制的解決方案。隨著模型開源社區的持續完善,預計將催生更多基于該架構的垂直領域應用。











