滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

通義端到端語音交互模型Fun-Audio-Chat發布

時間：2025-12-24 03:11:48 來源：鳳凰網科技編輯：快訊 IP：北京 發表評論無障礙通道

鳳凰網科技訊 12月23日通義大模型發布新一代端到端語音交互模型Fun-Audio-Chat。這是通義百聆語音模型系列中，首個主打“語音對語音”交互能力的模型，支持用戶直接通過語音與模型進行多輪對話。

從技術指標看，該模型在OpenAudioBench、VoiceBench、Ultraeval-Audio、MMAU、MMSU、SpeechFunctionCall等多項語音與多模態評測中取得當前開源模型中的領先成績，整體性能超過多款同參數規模模型，顯示出其在語音理解、生成以及對話協同上的綜合能力。

Fun-Audio-Chat-8B隸屬于通義百聆語音模型家族。此前，該系列已包含語音轉文字模型Fun-ASR以及文字轉語音模型Fun-CosyVoice3。與前兩者不同，Fun-Audio-Chat-8B強調端到端語音交互能力，可直接用于語音聊天、情感陪伴、智能終端交互以及語音客服等場景。目前，該模型已同步在魔搭社區、Hugging Face及GitHub開源。

在模型訓練與架構設計上，阿里云披露了兩項關鍵技術路徑。其一是Core-Cocktail 兩階段訓練策略，通過分階段引入語音與多模態能力，再與原有文本大模型參數融合微調，以降低新增能力對原有語言理解能力的影響，緩解“災難性遺忘”問題。其二是引入多階段、多任務的偏好對齊訓練，使模型在真實語音對話中能更準確捕捉語義與情緒線索，提升對話自然度。

算力效率也是該模型的一大特點。Fun-Audio-Chat-8B采用壓縮—自回歸—解壓縮的雙分辨率端到端架構，將音頻幀率降低至約 5Hz。在保證語音質量的前提下，該設計可節省近50%的GPU計算開銷，在當前語音大模型普遍算力成本較高的背景下，具有一定工程意義。

整體來看，Fun-Audio-Chat-8B的開源，標志著通義大模型在語音交互方向進一步向“低算力、強對話”的實用化階段推進，也為開源語音大模型在真實場景中的部署提供了新的技術參考。

更多>同類資訊

三星Galaxy A37/A57手機相機規格曝光

12-24

麗江古城喊話小紅書：消費者發布不實避雷貼損失慘重

12-24

儀式感拉滿！小米給員工發YU7定制車模印名字和工號

12-24

曝小米汽車已預研市面上所有智駕路線：含WA、VA等

12-24

抖音掀起“素人寫作”潮：筆尖流淌真情，平臺化身時代記憶新載體

12-24

AI浪潮下品牌營銷新路徑：影石等品牌以“活人感”破局出圈

12-24

光通信浪潮下亨通光電：前瞻布局顯成效，產能競爭待突圍

12-24

吳泳銘執掌阿里：戰略聚焦與AI驅動，開啟發展新篇章

12-24

AI浪潮下，火山引擎憑技術革新與生態布局，領跑大模型新賽道

12-24

抖音電商2025興趣產業帶觀察：超九千商家崛起，縣域經濟煥發新活力

12-24

科技浪潮與紅利基石：二級市場如何平衡攻守之道

12-24

釘釘加速AI化：以快為刃，重塑AI時代工作新范式

12-24

IP出海2025：從《瘋狂動物城》看中國IP的破局與新生之路

12-24

《瘋狂動物城2》爆火背后：IP出海陣痛中尋新路，未來何去何從？

12-24

浙江夫妻創業29年，靠做箱包逆襲，線上年銷超6億成行業黑馬

12-24

點擊查看更多 +

全站最新

從“能說”到“會做”：火山引擎以AI技術革新引領行業新增長

從后廚到全網：川廚以匠心辣味破圈，書寫互聯網時代美食新傳奇

互聯網賦能文教：以創新之姿，為孩子鋪就未來成長新路徑

京東攜手西部數據深化戰略合作共繪存儲市場消費與企服新圖景

釘釘加速AI化：半年百次迭代，重構未來工作新生態

鴻蒙智行首款MPV智界V9信息更新，2026年春季登場，配置亮點多

熱門內容

本欄最新

京東攜手西部數據深化戰略合作共繪存儲市場消費與企服新圖景

釘釘加速AI化：半年百次迭代，重構未來工作新生態

星途3.0時代啟航：以技術設計雙驅動開啟中國豪華汽車新篇章

全新奔馳GLB純電版來襲！800V架構+7座布局，續航超630km明年春上市

豪華質感VS科技生態，奧迪E5 Sportback與小米SU7誰更契合你？

快手遭黑灰產攻擊后緊急修復，直播功能短暫關閉后沖至蘋果免費榜第二

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

通義端到端語音交互模型Fun-Audio-Chat發布

日本精品一区二区三区高清久久