在摩爾線程舉辦的首屆MUSA開發者大會(MDC 2025)上,創始人張建中攜一系列重磅成果亮相,向行業展示了國產GPU在技術演進與生態建設上的全新突破。這場以“全功能GPU”為核心主題的發布會,不僅展現了摩爾線程從單點技術到系統級能力的跨越,更釋放出國產算力基礎設施邁向長期主義的明確信號。
張建中在演講中強調,GPU的發展史本質是算力邊界的持續拓展。從早期專注于圖形渲染,到通過可編程能力演變為通用并行計算平臺,再到如今成為AI時代的核心載體,GPU的每一次躍遷都源于對多樣化計算需求的響應。隨著生成式AI向具身智能、物理AI等新形態演進,未來五到十年,算力平臺需同時具備計算、仿真、圖形與感知能力,這決定了單一功能加速器無法滿足需求。
全功能GPU的架構設計正是為此而生。其核心在于集成四大計算引擎:AI計算引擎支撐模型訓練與推理,3D圖形渲染引擎服務數字內容生產,高性能計算引擎賦能科學模擬,智能視頻編解碼引擎優化云端算力傳輸。這種“四引擎協同”的模式,使得單一硬件平臺即可覆蓋從云端訓練到終端推理、從科學計算到數字孿生的全場景需求。
作為摩爾線程自主研發的元計算統一架構,MUSA在此次大會上升級至5.0版本,標志著其技術體系步入成熟階段。新架構原生支持MUSA C編程語言,深度兼容TileLang、Triton等國際主流語言,核心計算庫muDNN的GEMM與FlashAttention效率突破98%,編譯器性能提升3倍,并集成高性能算子庫,顯著加速訓練與推理全流程。
更值得關注的是MUSA的生態開放戰略。摩爾線程宣布將逐步開源計算加速庫、通信庫及系統管理框架等核心組件,并推出兼容跨代GPU指令的中間語言MTX、面向渲染+AI融合計算的muLang、量子計算框架MUSA-Q等工具鏈。這一舉措旨在構建“國際生態+國產生態”的雙輪驅動模式,覆蓋“云邊端”全系列產品,為開發者提供統一軟件棧支持。
基于MUSA體系,摩爾線程發布了新一代全功能GPU架構“花港”。該架構在計算密度、能效、精度支持與互聯能力上實現全面突破:算力密度提升50%,支持從FP4到FP64的全精度計算;通過自研MTLink高速互聯技術,可擴展至十萬卡級智算集群;內置AI生成式渲染架構與硬件光追引擎,圖形渲染性能較前代提升數倍。截至2025年6月,摩爾線程累計授權專利達514項,其中發明專利468項,為架構自主可控提供了堅實保障。
基于“花港”架構,摩爾線程規劃了兩款芯片:面向AI訓推一體的“華山”系列與專注圖形渲染的“廬山”系列。前者集成全精度張量計算單元,為萬卡集群提供穩定算力;后者在幾何處理、光線追蹤等關鍵指標上實現64倍性能提升,可支持3A游戲與高端創作場景。這兩款芯片的推出,標志著國產GPU在技術自研與場景覆蓋上邁入新階段。
大會現場,摩爾線程正式發布夸娥萬卡智算集群,成為國產GPU在集群系統層面的首個標桿案例。該集群浮點運算能力達10Exa-Flops,在Dense大模型訓練中算力利用率(MFU)達60%,MOE大模型達40%,訓練線性擴展效率95%,且兼容國際主流生態。在推理側,與硅基流動聯合優化的MTT S5000單卡在DeepSeek R1 671B模型上實現Prefill吞吐4000 tokens/s、Decode吞吐1000 tokens/s,刷新國產推理性能紀錄。
摩爾線程還預告了MTT C256超節點架構規劃。該產品采用計算與交換一體化設計,旨在提升萬卡集群的訓練效能與推理密度,為下一代智算中心提供硬件基石。從單卡到集群,從性能追趕到系統優化,摩爾線程的路徑選擇,折射出國產GPU從“可用”向“好用”的關鍵轉型。
這場發布會背后,是國產算力對長期主義的堅定選擇。面對供應鏈不確定性、技術封鎖與生態薄弱等挑戰,摩爾線程選擇以全功能GPU為支點,通過架構創新、生態開放與系統級優化,構建自主可控的算力基礎設施。這條道路或許漫長,但至少從MDC 2025開始,國產GPU的演進邏輯已清晰可循——不再局限于參數競爭,而是以技術深度與生態廣度,重新定義算力價值的邊界。






