在近日舉辦的一場聚焦全功能GPU技術(shù)的開發(fā)者大會(huì)上,國內(nèi)GPU企業(yè)摩爾線程公布了其覆蓋芯片、集群、終端設(shè)備的全棧技術(shù)布局,并展示了從云端訓(xùn)練到端側(cè)推理的完整解決方案。這場以自主計(jì)算架構(gòu)MUSA為核心的技術(shù)盛會(huì),吸引了業(yè)界廣泛關(guān)注。
基于自主研發(fā)的MUSA架構(gòu),摩爾線程推出了新一代全功能GPU架構(gòu)“花港”。該架構(gòu)支持從FP4到FP64的全精度計(jì)算,算力密度較前代提升50%,能效比提升10倍。通過集成新一代異步編程模型和MTLink高速互聯(lián)技術(shù),單卡片間互聯(lián)帶寬達(dá)1314GB/s,可支撐超十萬卡規(guī)模的智算集群部署。架構(gòu)中內(nèi)置的AI生成式渲染架構(gòu)和硬件光線追蹤引擎,使國產(chǎn)GPU首次實(shí)現(xiàn)對DirectX 12 Ultimate的完整支持,光線追蹤性能較前代提升50倍。
在芯片產(chǎn)品方面,摩爾線程同步披露了兩款重量級(jí)新品。面向AI訓(xùn)練場景的“華山”芯片集成全精度張量計(jì)算單元,支持FP4至FP64全精度計(jì)算,其浮點(diǎn)算力、訪存帶寬等關(guān)鍵指標(biāo)超越國際標(biāo)桿產(chǎn)品,部分配置達(dá)到行業(yè)頂尖水平。針對圖形渲染的“廬山”芯片則實(shí)現(xiàn)性能躍升:3A游戲性能提升至前代的15倍,AI計(jì)算性能提升64倍,幾何處理性能提升16倍,并配備4倍顯存容量和全新硬件光追引擎。
在云端計(jì)算領(lǐng)域,摩爾線程宣布建成國內(nèi)首個(gè)萬卡級(jí)智算集群“夸娥”。該集群浮點(diǎn)運(yùn)算能力達(dá)10EFLOPS,訓(xùn)練算力利用率在Dense大模型上達(dá)60%,MOE大模型上達(dá)40%,有效訓(xùn)練時(shí)間占比超過90%。通過軟硬協(xié)同優(yōu)化,集群完整復(fù)現(xiàn)了DeepSeek V3的FP8訓(xùn)練過程,自研FP8 GEMM算力利用率高達(dá)90%,F(xiàn)lash Attention算力利用率超95%。在推理性能方面,MTT S5000單卡在DeepSeek R1 671B模型上實(shí)現(xiàn)突破,Prefill吞吐突破4000 tokens/s,Decode吞吐突破1000 tokens/s,刷新國產(chǎn)GPU推理性能紀(jì)錄。
面向開發(fā)者生態(tài),摩爾線程推出了首款A(yù)I算力本MTT AIBOOK。這款搭載“長江”智能SoC芯片的設(shè)備,提供50TOPS異構(gòu)AI算力,配備32GB/64GB LPDDR5X內(nèi)存和1TB SSD存儲(chǔ)。設(shè)備預(yù)置AI開發(fā)環(huán)境與工具鏈,支持Linux開發(fā)、Windows辦公和Android應(yīng)用三系統(tǒng)無縫切換,可本地運(yùn)行最高30B參數(shù)的端側(cè)大模型。同步發(fā)布的MTT E300模組和預(yù)告的AI Cube迷你計(jì)算設(shè)備,均基于同一SoC架構(gòu)打造,形成覆蓋端邊側(cè)的完整計(jì)算產(chǎn)品矩陣。
在軟件生態(tài)建設(shè)方面,MUSA 5.0全棧軟件實(shí)現(xiàn)關(guān)鍵升級(jí)。新版本兼容CUDA C和原生MUSA C編程語言,深度適配TileLang、Triton等新興編程范式,編譯器性能提升3倍。通過開源計(jì)算加速庫、通信庫等核心組件,開發(fā)者可獲取底層優(yōu)化能力。即將推出的計(jì)算光刻庫muLitho,將加速OPC光刻計(jì)算進(jìn)程。圖形軟件棧方面,MUSA架構(gòu)率先實(shí)現(xiàn)硬件級(jí)光線追蹤加速,支持DirectX Raytracing標(biāo)準(zhǔn)。
大會(huì)特別設(shè)置的MUSA嘉年華展區(qū),集中展示了圖形+AI融合的最新成果。在具身智能領(lǐng)域,摩爾線程發(fā)布了MT Lambda仿真訓(xùn)練平臺(tái)和“端云結(jié)合”的MT Robot解決方案,并宣布將于2026年開源關(guān)鍵仿真加速組件Mujoco-warp-MUSA。目前,MUSA生態(tài)已與合作伙伴在AI for Science、量子科技、6G通信等前沿領(lǐng)域展開探索,持續(xù)拓展全功能GPU的技術(shù)邊界。
據(jù)公開數(shù)據(jù)顯示,截至2025年中,摩爾線程已累計(jì)獲得超過500項(xiàng)授權(quán)專利,其中發(fā)明專利占比達(dá)93.6%。通過構(gòu)建從芯片設(shè)計(jì)到軟件生態(tài)的完整技術(shù)棧,這家國產(chǎn)GPU企業(yè)正逐步形成覆蓋“芯-邊-端-云”的全場景計(jì)算能力,為構(gòu)建自主可控的智能計(jì)算生態(tài)奠定基礎(chǔ)。











