滾動資訊

當(dāng)前位置：首頁 > 資訊 > 業(yè)界動態(tài) > 正文內(nèi)容

阿里通義Qwen3-TTS家族再添新成員：音色克隆與定制隨心掌控

時間：2025-12-24 21:01:54 來源：ITBEAR編輯：快訊 IP：北京 發(fā)表評論無障礙通道

阿里通義近日宣布，其Qwen3-TTS家族迎來重要更新，正式推出兩款創(chuàng)新模型——音色創(chuàng)造模型Qwen3-TTS-VD-Flash和音色克隆模型Qwen3-TTS-VC-Flash。這兩款模型在語音合成領(lǐng)域展現(xiàn)出卓越性能，為用戶帶來前所未有的個性化語音體驗(yàn)。

Qwen3-TTS-VD-Flash作為音色創(chuàng)造領(lǐng)域的突破性成果，支持通過復(fù)雜自然語言指令實(shí)現(xiàn)音色的精細(xì)化調(diào)控。用戶可自由定義音色、韻律、情感及人設(shè)等參數(shù)，徹底擺脫傳統(tǒng)語音合成中預(yù)設(shè)音色或簡單克隆的限制。該模型在InstructTTS-eval評測中表現(xiàn)優(yōu)異，綜合評分顯著超越GPT-4o-mini-tts和Mimo-audio-7b-instruct，在角色扮演場景測試中更力壓Gemini-2.5-pro-preview-tts。其獨(dú)特的文本解析能力可自動處理復(fù)雜結(jié)構(gòu)，精準(zhǔn)提取關(guān)鍵信息，即使面對非規(guī)范化文本也能保持穩(wěn)定輸出。

另一款明星模型Qwen3-TTS-VC-Flash則專注于音色克隆技術(shù)，僅需3秒音頻樣本即可完成高精度克隆。該模型支持中、英、德、意、葡、西、日、韓、法、俄等10種主流語言的語音生成，在MiniMax TTS多語種測試集中，其平均詞錯誤率（WER）指標(biāo)全面領(lǐng)先MiniMax、ElevenLabs及GPT-4o-Audio-Preview等同類產(chǎn)品。特別在中文、英文、法文等語項(xiàng)的內(nèi)容穩(wěn)定性測試中，該模型展現(xiàn)出顯著優(yōu)勢。

兩款模型均具備高度擬人化的語音表現(xiàn)力，能夠根據(jù)文本語義自動調(diào)節(jié)語氣節(jié)奏，輸出自然生動的語音內(nèi)容。在技術(shù)實(shí)現(xiàn)上，Qwen3-TTS-VD-Flash允許用戶通過聲學(xué)屬性、人設(shè)描述、背景信息等自由組合，創(chuàng)造獨(dú)一無二的定制化聲音形象；Qwen3-TTS-VC-Flash則通過強(qiáng)化學(xué)習(xí)算法，在保持克隆音色特征的同時，顯著提升多語種語音生成的準(zhǔn)確性。

為方便開發(fā)者接入，阿里通義同步開放了Qwen3-TTS-Voice-Design和Qwen3-TTS-Voice-Clone的API文檔。這兩款模型的推出，標(biāo)志著語音合成技術(shù)從"標(biāo)準(zhǔn)化輸出"向"個性化創(chuàng)造"的重要跨越，將為有聲內(nèi)容創(chuàng)作、智能客服、虛擬主播等領(lǐng)域帶來全新可能。

12-24

飛利浦新推27英寸“27M2N5500XD”顯示器，2K 540Hz與720P 1000Hz雙模式切換

12-24

小米17 Ultra徠卡版亮相：可樂標(biāo)加持變焦環(huán)，還有驚喜“花活兒”

12-24

華碩a豆TF存儲卡京東上架：支持4K拍攝，32GB版僅35.9元起

12-24

Omdia報告：百度智能云成中國車企GenAI首選覆蓋超八成頭部車企

全球權(quán)威科技研究機(jī)構(gòu)Omdia近日發(fā)布的《2025年上半年中國汽車行業(yè)生成式AI市場全景》報告顯示，百度智能云成為中國車企最青睞的生成式AI（GenAI）合作伙伴，市場滲透率穩(wěn)居行業(yè)第一。通過視覺與語言能力的…

12-24

紅標(biāo)來了！小米公布17 Ultra徠卡版外觀

12-24

阿里最強(qiáng)“PS模型”開源！一手體驗(yàn)，0元P出氛圍感合影

12-24

Databricks 與 Glean 掌門人談 AI 落地的真實(shí)挑戰(zhàn)

12-24

前雅虎CEO六年折戟后轉(zhuǎn)身，新公司Dazzle打造 AI助理，尋求“谷歌級”影響力

12-24

蘋果2026年AI計劃曝光！聚焦點(diǎn)：基礎(chǔ)模型，團(tuán)隊(duì)一半來自谷歌，復(fù)旦系華人帶隊(duì)！

12-24

千問語音合成模型Qwen3-TTS 發(fā)布，支持3秒克隆音色和音色定制

12-24

這個業(yè)務(wù)，順豐不想干了

12-24

泡泡瑪特悉尼旗艦店亮相，成為南半球面積最大門店

12-24

抖音：截至11月共攔截1.2億條網(wǎng)暴評論，處置違規(guī)賬號超41萬個

12-24

點(diǎn)擊查看更多 +

全站最新

廣汽昊鉑A800啟動L3自動駕駛高速測試最高時速120公里展現(xiàn)硬實(shí)力

Omdia報告：百度智能云成中國車企GenAI首選覆蓋超八成頭部車企

影石無人機(jī)新品遭惡意抹黑，劉靖康：攻擊越猛越證方向正確

從“向外求”到“向內(nèi)生”：Z世代在社交中擁抱真實(shí)與自由的英雄之旅

嵐圖盧放直指新能源車內(nèi)卷癥結(jié)：回歸用戶創(chuàng)新經(jīng)營方破局

電動汽車充電站“高可靠性”如何衡量？行業(yè)標(biāo)準(zhǔn)與實(shí)現(xiàn)路徑何在？

熱門內(nèi)容

本欄最新

影石無人機(jī)新品遭惡意抹黑，劉靖康：攻擊越猛越證方向正確

科技巨頭“北京聚首”：從雷軍賠罪紅酒到李在镕訪廠，小米改寫行業(yè)規(guī)則

小米17 Ultra首發(fā)徠卡2億像素光學(xué)變焦長焦 1英寸主攝加持或成影像新標(biāo)桿

小米17Ultra徠卡版正式官宣融合百年影像精髓開啟專業(yè)攝影新篇章

12.98萬起售的銳勝M(fèi)8：大空間高配置，家庭商用皆宜的MPV新選擇

環(huán)球園藝沖刺港交所：小花盆“盆”出大生意，60%毛利率能否撐起全球夢？

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

阿里通義Qwen3-TTS家族再添新成員：音色克隆與定制隨心掌控

日本精品一区二区三区高清久久