在小米近期舉辦的一場合作伙伴大會上,一位95后科學家的亮相引發了廣泛關注。她就是羅福莉,曾是DeepSeek的核心成員,被業內譽為“天才少女”。此次她以小米MiMo大模型負責人的身份首次公開亮相,為小米在人工智能領域的發展帶來了新的思路與方向。
羅福莉在大會上的表現雖略顯青澀,與小米一貫成熟的營銷風格形成對比,但她帶來的開源模型MiMo-V2-Flash以及小米集團總裁盧偉冰宣布的未來五年2000億元研發投入規劃,都清晰地展現出小米在AI時代的戰略布局。當下,傳統硬件制造利潤不斷收窄,以大模型為核心的智能服務成為企業轉型和提升市值的關鍵因素。雷軍不惜重金引入羅福莉,既是對小米技術短板的補充,也是基于商業理性的戰略考量。
科技商業格局正經歷著深刻變革,掌握核心智能技術成為企業守護自身生態的關鍵。對于小米龐大的硬件生態而言,只有擁有自主的智能“大腦”,才能避免淪為他人的附庸。羅福莉在大會上提出了一個與眾不同的技術路線,與行業普遍追求的Scaling Law(規模法則)形成鮮明反差。
她指出,當前的大模型本質上只是“語言模擬器”,并非真正的智能體。她從哲學角度分析,人類進化是自下而上的,先有對物理世界的感知和行動,才產生語言;而當前AI的發展路徑卻完全相反,跳過了對真實世界的感知,直接從語言符號入手,這種“頭重腳輕”的路徑構建出的只是“空中樓閣”。例如,AI能寫出莎士比亞風格的詩歌,卻無法理解基本的物理法則,容易產生具身幻覺。她強調:“真正的智能源于交互,而非文本閱讀。”
基于這一理念,羅福莉為小米規劃了一條獨特的技術路線:不追求“全知全能”的云端模型,而是打造“知行合一”的物理大腦。在技術實現上,她展示的MiMo-V2-Flash采用了實用主義策略。該模型采用MoE(混合專家)架構,總參數達309B,但實際運行時僅激活15B,這種輕量化設計使其能夠適配手機和汽車的芯片。
為了實現這一目標,MiMo-V2-Flash采用了一系列工程策略。團隊鎖定了128個Token的滑動窗口,犧牲部分創意寫作能力,換取了極致的代碼執行和工具調用效率。在展示中,其推理速度是競爭對手DeepSeek-V3.2的3倍,成本僅為Gemini 2.5 Pro的二十分之一。羅福莉認為,算力和數據并非真正的競爭壁壘,如果大家都在參數上競爭,最終拼的只是GPU數量。而小米選擇的“物理世界”路線,拼的是科學的研究文化和問題定義能力。
她希望構建的,是一個能與物理世界交互、具備時空連貫性的“虛擬宇宙”。在這個宇宙中,AI的使命不是簡單的聊天,而是理解用戶指令背后的物理含義,如“把空調調高”背后的冷熱感知,或“路面結冰”后的駕駛邏輯。羅福莉的這一路線,正是為小米量身定制,旨在讓小米擁有具備“物理模型”的智能體,而非停留在“語言模擬器”層面。
當前,人工智能行業正面臨焦慮與轉型。OpenAI前首席科學家伊利亞·蘇茨克維曾預言,單純堆砌算力的邊際收益正在遞減,行業正從“規模時代”轉向“研究時代”。云端的聊天機器人未能如預期般重構所有應用,高昂的推理成本也讓商業模式難以為繼。在此背景下,模型的應用落地成為關鍵,競爭維度也從“模型聰明程度”轉向“物理世界入口的掌控”。
2025年,行業動態進一步印證了這一趨勢。字節跳動與中興通訊聯合推出“豆包手機”,阿里頻繁發布AI眼鏡,甚至OpenAI也試圖涉足硬件制造。這些軟件巨頭意識到,沒有硬件載體,再強大的模型也無法觸達真實世界。而小米作為“物理世界”的巨頭,擁有全球最大的消費級IoT平臺,連接著10.4億臺設備。這些設備是訓練“具身智能”的直接入口,為小米提供了獨特的優勢。
未來,小米有望從硬件銷售轉向“智能服務”提供,硬件成為載體,AI成為溢價核心,這也是其提升市場估值的關鍵。高盛曾指出,豆包的嘗試驗證了小米等硬件巨頭的結構性優勢,用戶選擇將受生態系統壁壘影響。然而,這對小米的模型交互能力提出了更高要求。如果MiMo模型不夠智能,用戶可能會選擇其他應用,導致小米設備淪為流量入口。
羅福莉提出的“端云結合”和“極致效率”理念雖具吸引力,但在算力受限的端側設備上實現高智商推理仍面臨物理定律的挑戰。如何讓數萬名傳統硬件開發工程師適應大模型時代的開發范式,也是小米需要解決的問題。雷軍投入2000億元、引入羅福莉,正是為了證明小米的原生模型比外來應用更優質。否則,小米的“人車家生態”可能失去靈魂,硬件淪為他人軀殼,這是任何有野心的科技企業都無法接受的結局。










