鳳凰網科技訊 12月10日,面壁智能宣布,VoxCPM 1.5版本正式上線并開源,多項核心能力升級。
其中,AudioVAE采樣率從16kHz提升至44.1kHz,模型可根據高質量音頻,克隆效果更佳、細節更豐富的聲音;VoxCPM 1.5僅需6.25個token即可生成1秒音頻,較此前版本提高一倍,在保持速度的同時提升了音頻生成質量。同時,VoxCPM 1.5版本穩定性增強,減少音頻偽影,優化長文本音頻的生成效果。
鳳凰網科技訊 12月10日,面壁智能宣布,VoxCPM 1.5版本正式上線并開源,多項核心能力升級。
其中,AudioVAE采樣率從16kHz提升至44.1kHz,模型可根據高質量音頻,克隆效果更佳、細節更豐富的聲音;VoxCPM 1.5僅需6.25個token即可生成1秒音頻,較此前版本提高一倍,在保持速度的同時提升了音頻生成質量。同時,VoxCPM 1.5版本穩定性增強,減少音頻偽影,優化長文本音頻的生成效果。