國(guó)內(nèi)芯片IP設(shè)計(jì)與服務(wù)領(lǐng)域的領(lǐng)軍企業(yè)安謀科技近日在上海舉辦新品發(fā)布會(huì),正式推出新一代“周易”X3 NPU,標(biāo)志著其“All in AI”產(chǎn)品戰(zhàn)略進(jìn)入實(shí)質(zhì)性落地階段。這款專為端側(cè)AI計(jì)算設(shè)計(jì)的處理器,憑借多項(xiàng)技術(shù)創(chuàng)新成為全場(chǎng)焦點(diǎn),其性能指標(biāo)與架構(gòu)設(shè)計(jì)均達(dá)到行業(yè)領(lǐng)先水平。
作為安謀科技自研IP矩陣的核心成員,“周易”X3 NPU采用專為大模型優(yōu)化的DSP+DSA通用架構(gòu),首次實(shí)現(xiàn)CNN與Transformer架構(gòu)的深度融合。該架構(gòu)支持單Cluster叢簇配置最多4個(gè)核心,F(xiàn)P8算力覆蓋8至80 TFlops區(qū)間,核心帶寬高達(dá)256GB/s。這種設(shè)計(jì)使其能夠靈活適配從智能汽車到移動(dòng)終端的多樣化場(chǎng)景,為AI加速卡、智能座艙、ADAS系統(tǒng)等提供端側(cè)計(jì)算支持。
架構(gòu)層面的突破性創(chuàng)新體現(xiàn)在四大核心模塊:自研解壓硬件WDC通過軟件無損壓縮技術(shù),將等效帶寬提升15-20%;新增的W4A8/W4A16計(jì)算模式專為大模型優(yōu)化,在保持精度的同時(shí)降低帶寬消耗;AIFF硬件引擎與專用調(diào)度器的組合,使CPU負(fù)載降至0.5%以下;多精度融合計(jì)算支持INT4/8/16/32及FP4/8/16/32等數(shù)據(jù)類型,平衡性能與能效的靈活性達(dá)到新高度。
實(shí)測(cè)數(shù)據(jù)顯示,相比前代X2型號(hào),X3在CNN模型性能上提升30-50%,多核算力線性度達(dá)到70-80%。在AIGC大模型場(chǎng)景中,其綜合性能實(shí)現(xiàn)10倍躍升,這得益于FP16算力、核心帶寬及Softmax性能的協(xié)同優(yōu)化。以Llama2 7B模型測(cè)試為例,Prefill階段算力利用率達(dá)72%,Decode階段在WDC硬件加持下有效帶寬利用率突破100%,顯著超越行業(yè)平均水平。
配套發(fā)布的“周易”Compass AI軟件平臺(tái)構(gòu)成完整解決方案。該平臺(tái)通過NN Compiler神經(jīng)網(wǎng)絡(luò)編譯器整合模型解析、優(yōu)化、生成等全流程工具,支持超過160種算子與270種模型。其創(chuàng)新性的Hugging Face“一鍵部署”功能,可直接處理主流AI框架模型,配合動(dòng)態(tài)shape支持與多樣化量化方案,將開發(fā)門檻降低60%以上。平臺(tái)還提供Bit精度仿真環(huán)境與多層次調(diào)試工具,支持Android、Linux等操作系統(tǒng)及SoC異構(gòu)計(jì)算。
發(fā)布會(huì)現(xiàn)場(chǎng)展示了“周易”系列產(chǎn)品的完整布局:Z1型號(hào)以0.32-3.75 TOPS算力覆蓋AIoT場(chǎng)景,已應(yīng)用于智能音箱等產(chǎn)品;Z2/Z3型號(hào)支持1.25-5 TOPS算力,面向入門級(jí)座艙市場(chǎng);X1型號(hào)10 TOPS算力服務(wù)高端AIoT設(shè)備;X2型號(hào)在10-30 TOPS區(qū)間實(shí)現(xiàn)端側(cè)多模態(tài)運(yùn)行,現(xiàn)場(chǎng)演示了Stable Diffusion文生圖功能;最新X3型號(hào)則通過8-80 FP8 TFLOPS算力,在DeepSeek-R1-Distill等主流大模型上展現(xiàn)出實(shí)時(shí)文生文、圖生文等交互能力。
安謀科技自2018年組建國(guó)內(nèi)首個(gè)NPU研發(fā)團(tuán)隊(duì)以來,已形成覆蓋CPU、SPU、多媒體處理的全棧自研體系。此次“周易”X3的發(fā)布,不僅完善了其AI計(jì)算產(chǎn)品矩陣,更通過軟硬協(xié)同的完整生態(tài),為智能汽車、移動(dòng)終端、物聯(lián)網(wǎng)等領(lǐng)域的大模型端側(cè)部署提供了關(guān)鍵基礎(chǔ)設(shè)施。隨著AIGC技術(shù)向邊緣側(cè)滲透,這款具備全棧自主能力的NPU有望成為推動(dòng)端側(cè)AI普及的重要力量。











