寒武紀公司近日宣布,其技術(shù)生態(tài)將全面接入北京智源人工智能研究院主導的眾智FlagOS開源系統(tǒng)軟件棧。這一合作旨在破解AI領(lǐng)域長期存在的"芯片架構(gòu)碎片化"難題,通過構(gòu)建統(tǒng)一軟件層實現(xiàn)不同硬件架構(gòu)間的無縫協(xié)同。
當前AI應用開發(fā)面臨嚴峻挑戰(zhàn):企業(yè)為適配不同業(yè)務場景,往往需要采購多種架構(gòu)的AI芯片。但跨芯片平臺遷移時,代碼重寫和性能調(diào)優(yōu)工作通常耗時數(shù)月,成為制約技術(shù)迭代的瓶頸。據(jù)行業(yè)調(diào)研顯示,超過60%的AI企業(yè)存在多芯片共存需求,但僅15%能實現(xiàn)高效跨平臺部署。
眾智FlagOS項目由智源研究院聯(lián)合產(chǎn)業(yè)伙伴于2023年啟動,其核心創(chuàng)新在于通過軟件層解耦實現(xiàn)"硬件無關(guān)性"。該系統(tǒng)整合了并行訓練框架FlagScale、高性能算子庫FlagGems等組件,已支持包括寒武紀在內(nèi)的20余種國內(nèi)外主流AI芯片。測試數(shù)據(jù)顯示,其算子性能平均超越芯片廠商原生實現(xiàn)12%-18%。
寒武紀與智源研究院的合作始于2024年初,雙方在關(guān)鍵技術(shù)組件上展開深度協(xié)同。聯(lián)合研發(fā)的FlagGems算子庫基于Triton架構(gòu)優(yōu)化,可自動適配不同芯片指令集;增強型編譯器FlagTree實現(xiàn)多后端統(tǒng)一管理;通信庫FlagCX則構(gòu)建了跨設備數(shù)據(jù)傳輸標準。這些技術(shù)突破使模型開發(fā)效率提升40%以上。
今年9月發(fā)布的FlagOS 1.5版本帶來多項升級:芯片支持數(shù)量擴展至12家廠商的20余款型號,并行調(diào)度算法優(yōu)化使大模型訓練效率提升最高36.8%,推理速度加快20%。特別值得關(guān)注的是,該版本完整支持機器人"大腦-小腦"協(xié)同開發(fā),為具身智能領(lǐng)域提供標準化技術(shù)底座。
技術(shù)專家指出,這種軟硬件協(xié)同創(chuàng)新模式正在重塑AI產(chǎn)業(yè)生態(tài)。通過消除底層硬件差異,開發(fā)者可專注于算法創(chuàng)新而非適配工作。寒武紀表示,未來將持續(xù)深化與FlagOS生態(tài)的融合,在分布式訓練、混合精度計算等方向展開聯(lián)合攻關(guān),推動AI技術(shù)向更高效、更普惠的方向發(fā)展。











