鳳凰網科技訊 12月15日,阿里通義宣布開源Fun-CosyVoice3-0.5B,該版本提供了zero-shot(注:零樣本)音色克隆能力,只需要你提供一段3秒以上的參考音頻,即可復刻其音色并合成新語音,并且支持本地部署和二次開發。
通義推出輕量化版本Fun-ASR-Nano模型,總參數量壓縮到0.8B,推理成本更低,現已開源,支持本地部署與定制化微調。
值得一提的是,通義還增強了Fun-ASR模型,噪聲場景準確率93%、支持歌詞與說唱識別。
鳳凰網科技訊 12月15日,阿里通義宣布開源Fun-CosyVoice3-0.5B,該版本提供了zero-shot(注:零樣本)音色克隆能力,只需要你提供一段3秒以上的參考音頻,即可復刻其音色并合成新語音,并且支持本地部署和二次開發。
通義推出輕量化版本Fun-ASR-Nano模型,總參數量壓縮到0.8B,推理成本更低,現已開源,支持本地部署與定制化微調。
值得一提的是,通義還增強了Fun-ASR模型,噪聲場景準確率93%、支持歌詞與說唱識別。