滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

阿里巴巴Qwen團隊發布AI新模型：文本生成聲音，三秒音頻克隆十種語言

時間：2025-12-24 18:30:25 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

阿里巴巴云計算旗下Qwen團隊近日推出兩款創新型語音生成模型，標志著人工智能在聲音處理領域取得重要突破。這兩款模型分別聚焦文本驅動的語音生成與短音頻克隆技術，為內容創作者、影視制作及語音交互場景提供全新解決方案。

其中，Qwen3-TTS-VD-Flash模型突破傳統語音合成框架，允許用戶通過自然語言描述精準控制聲音特征。用戶可同時指定性別、年齡、情感狀態、語速節奏等參數，例如生成"帶有磁性低音的年輕女性解說聲"或"充滿戲劇張力的老年男性獨白"。該模型在多維度聲音控制能力上已超越OpenAI近期發布的GPT-4o mini-tts接口，尤其在情感渲染與語調變化方面表現突出。

另一款Qwen3-TTS-VC-Flash模型則專注于語音克隆技術，僅需3秒原始音頻即可完成聲音特征提取。該技術突破語言限制，支持中、英、日、韓等十種語言的跨語種復現，且在音色保真度與口音還原方面達到行業領先水平。測試數據顯示，其語音克隆錯誤率較Elevenlabs、MiniMax等同類產品降低約37%，在短音頻克隆場景下優勢顯著。

技術團隊透露，這兩款模型具備多模態處理能力，除常規語音生成外，還可模擬動物叫聲、環境音效等特殊聲音。通過深度神經網絡架構，模型能自動識別錄音中的背景音并分離目標聲源，為影視后期制作提供高效工具。開發者可通過阿里巴巴云API直接調用模型服務，同時Hugging Face平臺已上線交互式演示界面，用戶可實時體驗聲音定制與克隆功能。

行業分析師指出，這兩款模型的推出將重塑語音內容生產流程。從有聲書錄制到虛擬主播，從游戲角色配音到智能客服，高度可控的語音生成技術正在創造新的應用場景。值得注意的是，模型內置的倫理審查機制可自動過濾不當內容，確保技術應用的合規性。

更多>同類資訊

小米17Ultra徠卡版來襲：首次獲紅標授權，成年輕用戶徠卡新選擇

12-24

知乎2025 AI榜單揭曉：豆包奪冠，垂直場景產品崛起，誰更得你心？

12-24

Jan團隊推出Jan-v2-VL-Max：300億參數多模態模型，長任務執行穩定性領先Gemini 2.5 Pro

12-24

格力電器：暫時沒有空調鋁代銅計劃

12-24

曝小米汽車預研市面上所有智駕路線，智駕團隊超1800人

12-24

部分用戶反映谷歌Pixel手機出現奇怪Bug：拍攝的照片不翼而飛

12-24

消息稱OPPO K Turbo系列高配版或搭載天璣9500s芯片

12-24

字節跳動推出新一代數學推理專用模型Seed Prover 1.5

12-24

小米汽車新專利可根據所處環境控制車輛鳴笛聲音

12-24

小米17 Ultra徠卡版“花活兒”揭秘：搭載“大師變焦環”，向單反看齊

12-24

百度文心 5.0 登頂 LMArena，超越 GPT-5.2，成中國 AI 新星！

12-24

訊飛星火大模型首獲國家安全標準認證，AI 安全再上新臺階！

12-24

阿里巴巴推出新款 Qwen 模型，三秒音頻即可克隆聲音

12-24

小米17 Ultra紅標徠卡版外觀公布

12-24

知乎2025 AI 榜單出爐:豆包登頂、DeepSeek 領跑，誰才是你心里的 AI 屆“鋼鐵俠”?

12-24

點擊查看更多 +

全站最新

AI數字人“入駐”大屏多場景，魔琺科技引領全空間智能交互新潮流

第五代寶馬X5將至：新增純電氫能版插混高性能版或配六缸引擎

新款寶馬M5原型車諜照來襲：前臉設計大改內飾革新升級

冬季胎壓報警莫亂來！科學三步走，輪胎養護與安全駕駛雙保障

車內按鍵密密麻麻難上手？掌握這些分區技巧，輕松5分鐘變“按鍵達人”

極氪“虎鯨”下月亮相！運動性能拉滿 45萬起挑戰寶馬X5L

熱門內容

本欄最新

極氪“虎鯨”下月亮相！運動性能拉滿 45萬起挑戰寶馬X5L

紅旗HS6 PHEV：以六大“更優”實力，開啟家庭出行新體驗

小米17 Ultra徠卡2億像素光學變焦來襲！獲APO認證配1英寸光影大師主攝

吳彥祖出任小米手機影像體驗官雷軍點贊#小米17Ultra#“紅毯運鏡”新模式

比亞迪全棧自研顯實力：從垂直整合到開放共享，引領新能源產業鏈升級新路徑

科大訊飛AI學習機P30深度評測：個性化學習新體驗，開啟高效學習之旅

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

阿里巴巴Qwen團隊發布AI新模型：文本生成聲音，三秒音頻克隆十種語言

日本精品一区二区三区高清久久