在近期舉辦的人車家全生態合作伙伴大會上,小米正式推出開源MoE模型Xiaomi MiMo-V2-Flash,其團隊負責人羅福莉首次公開亮相。這位曾被雷軍以千萬年薪引入的95后AI領域人才,此前是DeepSeek團隊成員,此次帶來的新模型在性能與成本方面展現出獨特優勢。
Xiaomi MiMo-V2-Flash的核心競爭力在于高效推理與高性價比。該模型總參數僅309B,激活參數為15B,而對比DeepSeek-V3.2的671B總參數和37B激活參數,小米模型在硬件資源調用上更為克制。實際測試顯示,其處理任務時調用的資源約為DeepSeek的一半,卻能達到與DeepSeek-V3.2、Kimi-K2等頭部開源模型相當的性能水平。
速度與成本方面,該模型每秒可輸出150個token,相當于每秒生成150個漢字,遠超DeepSeek-V3.2約每秒30個token的速率。在API服務定價上,小米模型每百萬輸入token收費0.7元,輸出token每百萬2.1元,價格僅為DeepSeek-V3.2的一半。這種“用更少的資源實現更快速度”的特性,延續了羅福莉此前在DeepSeek團隊對效率的追求風格。
功能層面,Xiaomi MiMo-V2-Flash支持一鍵生成電商頁面、小游戲等HTML網頁,且所有內容已開源。用戶可免費體驗網頁端服務,開發者在限定時間內可免費調用API。實際測試中,該模型在基礎問答場景表現亮眼:當被問及“如何安慰失戀朋友”時,響應時間為3.7秒,快于千問的5秒和DeepSeek-V3.2的10秒,回答內容質量相近。但在復雜任務中,模型仍存在提升空間——查詢最新AI新聞時,其返回結果為9月份信息,耗時20秒;而DeepSeek-V3.2僅用13秒便提供12月最新資訊。
翻譯功能測試顯示,Xiaomi MiMo-V2-Flash的譯文風格較為直白,缺乏靈活性。在生成網頁的高難度任務中,模型面對“豪華互動圣誕樹”3D網頁需求時多次卡頓,官方解釋稱這源于初期版本對圖形資源和實時渲染能力的限制,服務器對單次生成的算力分配存在上限。相比之下,豆包和DeepSeek-V3.2在同等要求下僅能提供文字描述,無法生成實際網頁。
與豆包的對比進一步凸顯了Xiaomi MiMo-V2-Flash的階段性特征。在信息檢索能力上,豆包會關聯多個網頁提供全面信息,而小米模型檢索范圍較小;功能多樣性方面,豆包已具備寫作、創作、通話、圖像處理等多樣化服務,小米模型目前僅開放深度思考和聯網搜索兩項功能。關閉深度思考模式后,小米模型的響應延遲顯著增加,回答質量下降,而豆包仍能提供可用信息。
此次模型發布選擇人車家全生態大會作為舞臺,暗示了小米的戰略布局。Xiaomi MiMo未來將作為連接汽車、家電、智能設備的核心工具,推動空調、燈光、音響等終端的智能協同。不過受限于當前技術成熟度,模型短期內可能僅應用于簡單場景,要實現設備間的深度邏輯理解,仍需持續優化迭代。










