豆包語音對話功能近日完成重要升級,新增四種方言對話能力,涵蓋粵語、四川話、東北話及陜西話。用戶通過豆包App發送文字或語音指令,選擇默認的“溫柔桃子”升級版音色,即可體驗方言對話服務。該功能突破傳統語音模型單音色限制,依托方言遷移技術實現同一音色流暢切換多種方言。
技術層面,豆包采用先進的語音模型架構,在保持音色統一性的同時賦予系統智能判斷能力。當用戶提出方言對話需求時,系統能根據對話語境自動識別意圖,并在四種方言間靈活轉換。例如用戶先用粵語詢問天氣后,可無縫切換至四川話繼續交流,無需重復設置參數。
除輸出能力外,該系統在方言識別領域也有突破性進展。通過整合ASR語音轉寫技術,系統可精準識別上海話、南京話等18種方言口語,并將內容實時轉化為標準文本。這項技術革新顯著提升了方言交互的準確率,據測試數據顯示,復雜語境下的識別錯誤率較前代產品下降37%。
實際應用場景中,方言對話功能已覆蓋生活服務、文化娛樂等多個領域。廣州用戶可用粵語查詢本地美食,成都用戶能以四川話討論川劇變臉技巧,東北用戶則可暢聊二人轉藝術特色。系統內置的文化知識庫包含各地方言特色詞匯庫,確保對話內容既地道又符合現代語境。
開發團隊透露,方言功能的實現依托于大規模方言語音數據庫建設。技術人員采集了超過200萬小時的方言語音樣本,涵蓋不同年齡、性別的發音特征。通過深度神經網絡訓練,系統不僅掌握了方言發音規則,還構建了方言語義理解模型,使對話回應更符合地域文化習慣。











