摩爾線程近日正式推出其全新華山GPU芯片,該芯片首發搭載自主研發的“花港”架構,聚焦AI訓練與推理場景的一體化能力,同時發布配套的超十萬卡級AI工廠技術與新一代高性能張量計算系統,標志著國產GPU在AI算力領域邁出關鍵一步。
基于“花港”架構的華山GPU,在系統級支撐技術上實現突破。其超十萬卡級AI工廠技術通過新一代Scale-up系統實現片間高效互聯,搭載MTLink 4.0協議與多種以太協議,片間互聯速度達134.5Gb/s,支持擴展至1024 GPU規模,并適配SHARP技術,可滿足大規模AI集群的協同運算需求。這一設計顯著提升了多卡訓練的效率,為超大規模模型訓練提供了硬件基礎。
在可靠性方面,華山GPU引入RAS 2.0技術,新增SRAM奇偶校驗及ECC能力,強化錯誤檢測、上報與隔離功能,同時優化調試能力,確保系統在長時間高負載運行下的穩定性。ACE2.0新一代異步通信引擎通過架構優化,進一步提升了通信調度效率,支撐大規模集群的協同運算,減少計算資源閑置。
計算性能方面,華山GPU采用新一代高性能張量計算系統,支持全精度MMA(矩陣乘法運算),涵蓋TF32、FP16等多種精度格式,并實現端到端加速的混合低精度計算。這一設計使其能夠高效適配大語言模型等AI場景需求,在保持計算精度的同時降低功耗,提升能效比。
根據公開性能指標,華山GPU在浮點算力、訪存帶寬、訪存容量及高速互聯帶寬等核心參數上全面超越英偉達Hopper架構產品,部分性能指標甚至媲美或超越其Blackwell架構產品。這一表現使其在AI大模型訓練與推理場景中具備顯著技術競爭力,為國產GPU在高端市場的突破提供了有力支撐。












