在小米人車家全生態大會上,一款名為MiMo-V2-Flash的新模型成為全場焦點。這款由“天才少女”羅福莉主導研發的模型,以309B參數、15B激活參數的“小身板”,在代碼能力和Agent性能上展現出驚人實力,甚至在部分國際權威榜單中躋身全球開源模型前列。
“這個尺寸的模型,我們甚至不愿稱之為‘大模型’。”羅福莉在發布會上坦言。但正是這個“小模型”,在SWE-Bench Multilingual測試中超越了GPT-5等閉源巨頭,在代碼生成、工具調用等核心指標上與DeepSeek-V3、Kimi K2-Thinking等模型持平,而參數規模僅為后者的1/2至1/3。更令人矚目的是其性價比:推理價格僅為Claude Sonnet 4.5的2.5%,生成速度卻達到2倍,API定價輸入0.7元/百萬tokens、輸出2.1元/百萬tokens,在國產模型中極具競爭力。
支撐這一性能突破的,是小米自主研發的混合注意力機制。該模型采用5:1的滑動窗口注意力(SWA)與全局注意力(GA)混合結構,既保證了長文本處理能力,又通過固定KV Cache設計兼容現有基礎設施。實驗數據顯示,SWA在推理效率和長文理解上優于主流線性注意力機制,為模型輕量化提供了關鍵技術路徑。
盡管性能亮眼,但309B的參數規模仍與端側部署存在距離。羅福莉在演講中透露,小米的AI戰略正沿著兩條主線推進:一是持續優化端側模型,通過“超級小愛”和澎湃OS升級,將AI能力深度融入手機、家居等終端設備;二是攻堅物理模型,以MiMo-Embodied具身智能大模型為基座,打通自動駕駛與機器人技術的知識遷移,構建覆蓋人車家全生態的通用AI框架。
這一戰略背后,是小米對AI的巨額投入。集團總裁盧偉冰在財報會上明確,2025年研發投入將超300億元,其中四分之一投向AI領域,未來五年計劃投入超2000億元。組織層面,小米已搭建自有AI Infra平臺,并秘密組建GPU萬卡集群,初始團隊即掌握6500張GPU資源。人才方面,除羅福莉領銜基礎模型研發外,還引入陳龍團隊攻克智駕領域,其開源的跨具身基座模型MiMo-Embodied,已實現自動駕駛與機器人技術的底層邏輯統一。
從4月開源MiMo-7B系列,到5月突破多模態視覺理解,再到11月整合自動駕駛與機器人技術,小米的AI布局呈現加速態勢。12月MiMo-V2-Flash的發布,標志著其技術路線正式從“預訓練”轉向“后訓練”,通過強化學習范式激發模型潛能。羅福莉在結語中描繪的“虛擬宇宙”愿景——一個具備物理一致性和時空連貫性的交互世界,或許正是小米試圖用AI重構硬件生態的終極目標。
對于這家擁有超10億臺設備連接量的硬件巨頭而言,AI不僅是技術競賽,更是生態戰爭。從手機到家居,從智駕到機器人,小米正試圖用一套通用AI邏輯驅動所有硬件,將“設備互聯”升級為“智能共生”。這場變革的成敗,不僅取決于模型參數的大小,更在于技術能否真正滲透至每個終端,轉化為用戶可感知的體驗升級。








