安謀科技近日正式推出面向端側大模型優化的新一代NPU IP“周易”X3,該產品通過與Arm架構CPU、GPU協同工作,構建起基于Arm生態的異構計算解決方案。此次發布的芯片架構在模型兼容性、硬件性能、軟件生態等維度實現突破,標志著端側AI算力進入系統性優化階段。
硬件架構層面,“周易”X3采用DSP+DSA混合計算架構,支持從定點到浮點的計算模式轉換。單Cluster算力覆蓋8-80TFLOPS(FP8精度),單核帶寬最高達256GB/s。其專屬AI硬件引擎AIFF配合硬化調度器,可將CPU負載降低至0.5%,同時實現微秒級調度延遲。該架構突破傳統CNN限制,原生支持Transformer等主流大模型架構,算子庫擴展至160余個,兼容超過270種模型類型。
軟件生態建設方面,配套的Compass AI平臺構建起全棧工具鏈,已實現對TensorFlow、PyTorch等主流框架的無縫銜接。平臺特別強化了大模型動態Shape處理能力,集成GPTQ量化方案和Hugging Face模型庫,支持LLM、VLM等復雜模型部署。在性能實測中,CNN模型處理效率較前代提升30-50%,AIGC大模型算力利用率在特定場景下突破100%,多核擴展線性度達到70-80%。
現場演示環節展示了多個端側AI落地場景:搭載“周易”X3的AI PC設備可本地運行MinicpM v2.6視覺模型,實現毫秒級圖像識別;在文生圖測試中,Stable Diffusion v1.5模型生成圖像清晰度顯著提升,創作周期縮短至秒級;文本生成任務中,DeepSeek-R1模型在tokens生成速度和對話流暢度方面均有突破。這些應用驗證了新架構在保持低功耗的同時,能效比達到行業領先水平。
作為國內最早布局NPU研發的團隊之一,安謀科技自2018年組建專項組以來,已連續交付五代產品。公司產品研發負責人強調,當前端側AI發展已從單純追求算力轉向系統優化,需要構建涵蓋芯片設計、算法優化、生態支持的完整解決方案。此次發布的“周易”X3標志著安謀科技在AI戰略上邁出關鍵一步,其技術成果已應用于智能座艙、ADAS、機器人等十余個領域,形成覆蓋移動終端、智能物聯、汽車電子的完整產品矩陣。









