前DeepSeek研究員羅福莉正式加入小米的消息,通過其朋友圈動態得以確認。這位被稱為"AI天才少女"的95后科學家,將參與小米"端側AI"與"人車家全生態"的戰略布局。她在DeepSeek期間積累的MoE架構經驗,恰好契合小米"輕量化、不拼參數"的AI發展路徑。據知情人士透露,羅福莉的工作領域不僅限于大模型開發,更涉及手機、汽車等終端產品的AI落地應用。
羅福莉在朋友圈發布動態稱:"智能終將從語言邁向物理世界。我正在Xiaomi MiMo,和一群富有創造力、才華橫溢且真誠熱愛的研究員,致力于構建這樣的未來。"這一表述與其在DeepSeek時期的技術理念一脈相承。今年初,她曾以"接地氣"的方式在知乎解讀DeepSeek-V2模型優勢,展現出對技術落地的深刻理解。
追溯其學術軌跡,這位四川宜賓出生的科學家,2013年考入北京師范大學計算機專業,后保送至北京大學計算語言學研究所。2019年讀研二期間,她在人工智能領域頂級會議ACL上一次性發表8篇論文,其中2篇為第一作者,由此嶄露頭角。畢業后進入阿里達摩院,主導開發了多語言預訓練模型VECO,該模型被納入阿里深度語言模型體系AliceMind并推動開源。
2022年加入DeepSeek后,羅福莉參與研發的DeepSeek-V2模型以"性價比之王"著稱,其中文水平處于國內外閉源模型第一梯隊,價格僅為GPT-4的1/100。盡管未參與今年初爆火的V3和R1模型研發,但她在混合專家架構領域的技術積累,成為小米AI戰略的關鍵拼圖。
小米的AI布局早在2016年就已啟動,初期主要為小愛音箱等IoT產品服務。2023年4月,隨著大語言模型熱潮興起,小米AI實驗室下設專門大模型團隊,由曾任東芝研究院研究員的欒劍負責。不同于行業主流的"軍備競賽"思路,小米明確"不搞ChatGPT"的差異化戰略,強調輕量級模型的市場價值。
這種戰略轉向在技術成果上得到驗證。今年4月開源的Xiaomi MiMo推理大模型,以70億參數在數學推理和代碼競賽中超越OpenAI o1-mini和阿里QwQ-32B等更大參數模型。該成果出自新成立的"小米大模型Core團隊",而羅福莉此次加入的MiMo團隊,正是這一技術路徑的核心執行者。
硬件層面的投入為AI戰略提供支撐。2024年雷軍推動建設的GPU萬卡集群,年中已擁有6500張GPU,并計劃擴容至萬卡規模。2025年2月公布的研發預算顯示,全年300億元研發費用中,75億元將投向AI領域,重點支持GPU集群建設和大模型場景落地。未來五年(2026-2030年)預計投入超2000億元,聚焦AI、OS、芯片三大底層技術,構建"人車家"生態的技術底座。
行業觀察人士指出,頂尖AI人才從新銳公司向傳統硬件巨頭的流動,標志著AI競爭進入"應用深化期"。當基礎模型能力逐漸趨同,如何將AGI能力轉化為手機、汽車、智能家居中的真實體驗,成為新的競爭焦點。羅福莉提出的"從語言邁向物理世界"理念,正是這一趨勢的技術注腳。











