在近日舉辦的世界互聯網大會·烏鎮峰會前沿人工智能模型論壇上,螞蟻集團平臺技術事業群負責人駱驥透露,該集團已建成具備萬卡規模的國產化算力基礎設施。這一由國產芯片構建的集群不僅支持螞蟻自研模型及主流開源框架,更在系統穩定性方面取得突破性進展,連續訓練任務成功率保持在98%以上。
據技術團隊介紹,該算力集群通過架構優化與算法調優,在模型訓練效率與推理響應速度等核心指標上,已達到國際同類產品的同等水平。特別在安全風控場景中,依托該集群構建的大模型系統,能夠實時處理海量數據并完成風險識別,為金融業務提供智能化支撐。
值得關注的是,這套國產化解決方案實現了從硬件到軟件的全鏈路自主可控。工程團隊通過分布式訓練框架創新,解決了大規模集群下的通信瓶頸問題,同時開發了動態資源調度系統,使算力利用率較傳統方案提升40%以上。目前該集群已承載螞蟻集團多個核心業務的模型訓練任務,日均處理數據量超過PB級。
業內專家指出,萬卡級國產算力集群的落地,標志著我國在人工智能基礎設施領域取得重要進展。這種自主可控的技術棧不僅降低了對進口芯片的依賴,更通過定制化優化釋放了國產硬件的潛在性能,為金融科技等關鍵領域提供了安全可靠的算力保障。











