豆包語音對話功能近日完成重要升級,新增四種方言交互能力,覆蓋粵語、四川話、東北話及陜西話。用戶通過豆包App發送文字或語音指令,選擇"溫柔桃子"升級版音色后,即可體驗方言對話服務。該功能突破傳統語音助手單音色限制,依托方言遷移技術實現單一音色流暢切換多種方言,系統會根據對話場景自動識別用戶意圖并調整方言類型。
技術團隊介紹,方言交互功能采用深度神經網絡架構,通過海量方言數據訓練構建語言模型。實測顯示,系統對方言語音的識別準確率達92%以上,能精準解析方言特有的詞匯結構和語法特征。例如在回應粵語用戶時,不僅使用標準粵語發音,還會自然融入"唔該""啱啱好"等地域特色表達,使對話更貼近真實交流場景。
針對方言理解能力,豆包同步升級了ASR語音識別模塊,現已支持上海話、南京話等18種方言的語音轉文字功能。該模塊通過多模態融合技術,將方言語音特征與語義理解深度結合,在嘈雜環境下仍能保持87%的識別準確率。測試數據顯示,系統處理方言語音的響應速度較舊版提升40%,特別優化了老年用戶常用的生活場景詞匯庫。
產品負責人表示,方言功能開發源于對多元用戶需求的深度洞察。調研發現,35%的老年用戶更習慣使用方言交流,在醫療咨詢、生活服務等場景存在溝通障礙。此次升級重點優化了方言語音的韻律特征,通過調整語調起伏和停頓節奏,使機器語音更接近真人對話效果。目前方言功能已覆蓋全國主要方言區,后續將持續擴展方言種類和適用場景。
技術文檔顯示,方言遷移技術采用分層編碼架構,將語音特征分解為基礎音色層和方言特征層。這種設計既保留了"溫柔桃子"音色的統一性,又通過動態加載方言特征包實現靈活切換。在連續對話場景中,系統能根據用戶前序用語自動判斷方言類型,無需每次重復指定。例如用戶先用粵語提問后,系統會自動保持粵語回應模式直至對話結束。













