“存力中國行”北京站活動近日在中國信息通信研究院圓滿落幕。這場匯聚產業(yè)鏈上下游企業(yè)代表、專家學者及媒體的盛會,將目光聚焦于AI推理時代存儲技術面臨的挑戰(zhàn)與創(chuàng)新路徑。隨著AI技術從模型研發(fā)向行業(yè)規(guī)模化應用邁進,推理階段的性能優(yōu)化、效率提升與成本控制成為決定技術落地成效的關鍵因素,先進存儲技術作為核心支撐,正迎來技術革新與生態(tài)協(xié)同的關鍵轉折點。
當前AI產業(yè)已從“模型競賽”轉向“應用深耕”,大模型數(shù)量趨于穩(wěn)定,推理需求呈現(xiàn)爆發(fā)式增長。金融風控、醫(yī)療診斷、電商推薦等場景的深度滲透,推動Token調用量呈指數(shù)級上升,標志著“Token經濟”時代的全面到來。然而,這一繁榮景象背后,三大核心矛盾日益凸顯:數(shù)據(jù)層面,多模態(tài)數(shù)據(jù)激增使存儲容量需求從PB級躍升至EB級,異構數(shù)據(jù)格式與流通障礙導致高質量數(shù)據(jù)集構建成本高昂;性能層面,KV Cache技術的普及對存儲帶寬與延遲提出嚴苛要求,傳統(tǒng)架構難以滿足存算協(xié)同需求;成本層面,HBM等高端存儲介質價格居高不下,疊加推理負載的波動性特征,使得中小企業(yè)智能化轉型面臨高門檻。
面對行業(yè)痛點,存儲技術正經歷從“被動承載”到“智能協(xié)同”的范式轉變。核心突破點在于構建以KV Cache為中心的推理記憶數(shù)據(jù)湖,通過存儲、計算、網絡與框架的深度融合,重構推理效能。華為推出的UCM統(tǒng)一緩存管理技術,通過HBM-DRAM-SSD三級緩存架構,將非活躍KV Cache動態(tài)遷移至高性能SSD,在不增加硬件成本的前提下,實現(xiàn)首Token延遲降低90%、系統(tǒng)吞吐量提升22倍、上下文窗口擴展10倍的突破性效果。更值得關注的是,UCM技術已于2025年9月在魔擎社區(qū)開源,向全行業(yè)開放接口,此舉不僅降低了中小企業(yè)獲取先進推理加速能力的門檻,更通過推動技術標準統(tǒng)一,加速千行百業(yè)智能化進程。
系統(tǒng)性協(xié)同創(chuàng)新成為釋放AI潛能的關鍵。在中國信息通信研究院牽頭下,華為、中國移動、浪潮等企業(yè)成立“先進存力AI推理工作組”,圍繞技術研究、標準制定、方案落地與生態(tài)構建四大方向展開合作。技術層面,芯片廠商的3D堆疊技術、存儲廠商的架構創(chuàng)新與云服務商的平臺優(yōu)化形成良性互動,例如硅基流動的推理框架與華為昇騰算力及UCM技術適配,實現(xiàn)軟硬件協(xié)同增效;運營商則發(fā)揮網絡優(yōu)勢,推動存算網深度融合,移動云探索的以太網協(xié)議棧替代RDMA方案,為存量資源復用提供新路徑。
我國存儲產業(yè)已具備扎實的發(fā)展基礎。截至2025年6月,全國存儲總規(guī)模達1680EB,先進存儲占比提升至28%,距離《算力基礎設施高質量發(fā)展行動計劃》設定的2025年目標僅一步之遙。技術層面,國產分布式存儲產品、AI存儲系統(tǒng)多次在國際權威測試中奪冠,232層三維閃存芯片達到國際先進水平,閃存主控芯片實現(xiàn)商用突破,產業(yè)鏈自主可控能力顯著增強。這些成果為AI推理存儲革新提供了堅實保障,也為應對國際技術競爭構筑了產業(yè)屏障。
先進存儲技術正從單一的數(shù)據(jù)容器演變?yōu)锳I智算體系的“協(xié)同中樞”。隨著技術創(chuàng)新持續(xù)深化與產業(yè)生態(tài)不斷完善,存儲技術將徹底破解AI推理的性能、成本與效率難題,推動智能化轉型從大企業(yè)專屬向中小企業(yè)普惠轉變。當AI技術真正融入生產線、診室與客服場景,其價值將不再取決于模型參數(shù)規(guī)模,而在于能否在真實業(yè)務中實現(xiàn)“快速響應、精準決策、成本可控”。先進存儲技術通過突破內存墻、容量墻與成本墻,正在讓這一愿景成為現(xiàn)實。










