華為近日正式推出名為Flex:ai的創(chuàng)新型AI容器軟件,該技術(shù)通過(guò)精細(xì)化算力管理方案,為人工智能應(yīng)用場(chǎng)景提供更高效的資源分配模式。其核心突破在于實(shí)現(xiàn)了單張GPU或NPU算力卡的虛擬化切分,可將物理算力單元細(xì)分為多個(gè)獨(dú)立虛擬資源,切分精度達(dá)到10%級(jí)別。這種技術(shù)架構(gòu)使得單張算力卡能夠同時(shí)承載多個(gè)AI任務(wù),顯著提升了硬件資源的利用率。
在集群管理層面,F(xiàn)lex:ai開(kāi)發(fā)了動(dòng)態(tài)算力聚合機(jī)制,能夠自動(dòng)識(shí)別并整合分布式節(jié)點(diǎn)中的閑置XPU資源。通過(guò)構(gòu)建跨節(jié)點(diǎn)的共享算力池,該系統(tǒng)可根據(jù)實(shí)際需求靈活調(diào)配算力,有效解決傳統(tǒng)模式下算力碎片化導(dǎo)致的資源浪費(fèi)問(wèn)題。這種彈性架構(gòu)尤其適用于AI訓(xùn)練與推理場(chǎng)景中負(fù)載波動(dòng)較大的情況,能夠快速響應(yīng)不同任務(wù)的算力需求。
技術(shù)實(shí)現(xiàn)方面,研發(fā)團(tuán)隊(duì)突破了傳統(tǒng)虛擬化技術(shù)的性能損耗瓶頸,通過(guò)優(yōu)化內(nèi)存管理與通信協(xié)議,確保虛擬算力單元在保持獨(dú)立性的同時(shí),仍能接近物理硬件的原始性能。測(cè)試數(shù)據(jù)顯示,在多任務(wù)并行場(chǎng)景下,系統(tǒng)整體吞吐量較傳統(tǒng)方案提升3倍以上,任務(wù)切換延遲控制在毫秒級(jí)。
為推動(dòng)技術(shù)生態(tài)建設(shè),華為決定將Flex:ai的核心代碼開(kāi)源至魔擎開(kāi)發(fā)者社區(qū)。此舉旨在吸引全球開(kāi)發(fā)者參與技術(shù)迭代,共同完善AI基礎(chǔ)設(shè)施的標(biāo)準(zhǔn)化建設(shè)。開(kāi)源版本已包含完整的API接口文檔與開(kāi)發(fā)工具鏈,支持主流深度學(xué)習(xí)框架的無(wú)縫對(duì)接,開(kāi)發(fā)者可基于現(xiàn)有代碼快速構(gòu)建定制化解決方案。












