安謀科技近日正式推出專為端側(cè)大模型設(shè)計(jì)的全新一代NPU IP——“周易”X3。這款產(chǎn)品通過(guò)與Arm架構(gòu)CPU、GPU協(xié)同工作,構(gòu)建起基于Arm生態(tài)的異構(gòu)算力解決方案,標(biāo)志著端側(cè)AI算力進(jìn)入系統(tǒng)性優(yōu)化新階段。
研發(fā)團(tuán)隊(duì)負(fù)責(zé)人透露,“周易”X3采用創(chuàng)新的DSP+DSA架構(gòu),實(shí)現(xiàn)從定點(diǎn)計(jì)算向浮點(diǎn)計(jì)算的跨越。該架構(gòu)具備通用性、靈活性和高效性三大特點(diǎn),通過(guò)軟硬件深度協(xié)同設(shè)計(jì),單Cluster算力覆蓋8-80TFLOPS(FP8),單核心帶寬最高達(dá)256GB/s。特別設(shè)計(jì)的AI專屬硬件引擎AIFF配合硬化調(diào)度器,將CPU負(fù)載降低至0.5%,調(diào)度延遲控制在極低水平。
在軟件生態(tài)構(gòu)建方面,Compass AI平臺(tái)已實(shí)現(xiàn)與TensorFlow、ONNX、Pytorch等主流框架的無(wú)縫對(duì)接,支持GPTQ量化方案和Hugging Face模型庫(kù)。該平臺(tái)可處理LLM、VLM、VLA、MoE等多元模型類型,算子支持?jǐn)?shù)量突破160個(gè),模型兼容性超過(guò)270種。實(shí)測(cè)數(shù)據(jù)顯示,CNN模型性能較前代提升30-50%,AIGC大模型處理能力提升10倍,多核算力線性度達(dá)70-80%,大模型Prefill階段算力利用率提升至72%,Decode階段有效帶寬利用率在開啟自研解壓引擎WDC后突破100%。
發(fā)布會(huì)現(xiàn)場(chǎng)演示環(huán)節(jié)展示了多個(gè)落地場(chǎng)景:基于“周易”X3的AI PC可本地運(yùn)行MinicpM v2.6模型,實(shí)現(xiàn)實(shí)時(shí)拍照識(shí)圖功能;在文生圖應(yīng)用中,Stable Diffusion v1.5模型運(yùn)行流暢,圖片生成速度達(dá)到秒級(jí);文生文場(chǎng)景下,DeepSeek-R1-Distill-Qwen-1.5B模型顯著提升了對(duì)話流暢度和tokens生成效率。這些案例驗(yàn)證了新一代NPU在提升AI應(yīng)用體驗(yàn)流暢度方面的突破性進(jìn)展。
該技術(shù)已形成完整解決方案矩陣,覆蓋加速卡、AI PC、AI手機(jī)、具身智能、智能座艙、ADAS及智能IPC等多個(gè)領(lǐng)域。自2018年組建國(guó)內(nèi)首個(gè)NPU研發(fā)團(tuán)隊(duì)以來(lái),安謀科技已交付五代產(chǎn)品,形成100%本土化的研發(fā)支持體系。當(dāng)前戰(zhàn)略聚焦"AI Arm China"方向,通過(guò)持續(xù)迭代NPU產(chǎn)品線,為端側(cè)AI爆發(fā)提供核心算力支撐。








