科技領(lǐng)域迎來一項(xiàng)突破性合作,芯片巨頭博通與人工智能企業(yè)CAMB.AI宣布聯(lián)合研發(fā)新型AI芯片組,該技術(shù)將實(shí)現(xiàn)設(shè)備端實(shí)時音頻翻譯功能,無需依賴云端服務(wù)器即可完成復(fù)雜語言處理任務(wù)。這項(xiàng)創(chuàng)新方案主要針對智能電視、智能音箱等消費(fèi)電子產(chǎn)品,通過集成在SoC芯片中的專用模塊,將翻譯、配音及口述影像服務(wù)直接部署在本地設(shè)備。
核心技術(shù)創(chuàng)新在于突破傳統(tǒng)云端處理模式,所有音頻數(shù)據(jù)在設(shè)備內(nèi)部完成解析與轉(zhuǎn)換。以口述影像功能為例,系統(tǒng)能實(shí)時識別視頻畫面中的動作細(xì)節(jié)、場景切換及文字信息,并通過語音合成技術(shù)向視力障礙用戶同步解說。這項(xiàng)輔助功能已通過電影《美食總動員》的測試片段驗(yàn)證,演示中AI系統(tǒng)可同時用多種語言生成場景描述,并在屏幕顯示對應(yīng)字幕。
技術(shù)團(tuán)隊(duì)強(qiáng)調(diào)兩大顯著優(yōu)勢:隱私安全與處理效率。由于數(shù)據(jù)全程在本地設(shè)備流轉(zhuǎn),有效規(guī)避了云端傳輸可能引發(fā)的隱私泄露風(fēng)險;支持超過150種語言的處理能力,配合本地化運(yùn)算架構(gòu),使翻譯延遲控制在毫秒級,同時減少70%以上的無線帶寬占用。該語音模型已獲得NASCAR賽事轉(zhuǎn)播及康卡斯特流媒體平臺的實(shí)際應(yīng)用驗(yàn)證。
目前研發(fā)仍處于工程驗(yàn)證階段,距離商業(yè)化落地尚需攻克散熱控制、多任務(wù)協(xié)同等工程難題。但業(yè)內(nèi)專家指出,這項(xiàng)技術(shù)若成功量產(chǎn),將重新定義智能設(shè)備的交互方式——用戶觀看外語節(jié)目時可實(shí)時切換配音語言,智能音箱能同步轉(zhuǎn)譯多語種對話,物聯(lián)網(wǎng)設(shè)備間的跨語言通信也將成為現(xiàn)實(shí)。特別是對于全球3.4億視障群體,這項(xiàng)技術(shù)將顯著提升他們獲取視聽內(nèi)容的便利性。
參與研發(fā)的工程師透露,芯片組采用模塊化設(shè)計,可靈活適配不同硬件平臺。測試設(shè)備顯示,在4K視頻播放場景下,新增的AI模塊僅占用5%的運(yùn)算資源,功耗增加不足2瓦。這項(xiàng)特性使其特別適合嵌入式設(shè)備升級,現(xiàn)有智能電視通過固件更新即可獲得部分功能支持。












