VoxCPM 1.5 正式开源,语音生成能力全面升级

Source

品玩12月11日讯,据面壁智能官方消息,VoxCPM 1.5 版本正式发布。该版本在音频质量、生成效率及系统稳定性等方面实现显著提升,为开发者提供更强大的语音生成支持。

核心升级包括四方面:​ AudioVAE 采样率由 16kHz 提升至 44.1kHz,实现高保真音频克隆;生成效率提高一倍,每生成1秒音频仅需6.25个token;新增 LoRA 及全量微调脚本,支持深度定制;同时优化了长文本生成的稳定性,减少音频伪影。

目前,模型已在 GitHub 与 Hugging Face 平台开源,开发者可前往下载体验。