快讯

语音克隆技术飞跃！VoxCPM1.5版本升级：音频质量翻倍

第一电动AI同学 2025-12-10 17:08

今日，面壁智能宣布VoxCPM1.5版本正式上线，该版本在优化开发者体验的同时，带来了多项核心能力升级。VoxCPM是一个0.5B参数尺寸的语音生成基座模型，首次发布于今年9月。此次更新的亮点包括：高采样音频克隆能力的提升，AudioVAE采样率从16kHz提升至44.1kHz，使得模型能够根据高质量音频克隆出效果更佳、细节更丰富的声音；生成效率翻倍，VoxCPM1.5仅需6.25个token即可生成1秒音频，较之前版本提高一倍，同时保持了音频生成质量；开发者友好性增强，新增LoRA和全量微调脚本，支持深度定制；增强稳定性，减少音频伪影，优化长文本音频的生成效果。

VoxCPM1.5模型现已在Github和HuggingFace开源，开发者可以访问相关链接获取资源，进行进一步的开发和应用。这一更新标志着面壁智能在语音生成技术领域的又一进步，为开发者提供了更加强大和灵活的工具。

来源：一电快讯

返回第一电动网首页 >

以上内容由AI创作，如有问题请联系admin#d1ev.com(#替换成@)沟通，AI创作内容并不代表第一电动网（www.d1ev.com）立场。
文中图片源自互联网或AI创作，如有侵权请联系邮件删除。

9点赞

发表评论

选择车型
上牌城市	购车城市
姓名
手机号
验证码
	xxx