信息差

ZyphraAI 发布开源 Zonos-TTS：实现实时语音克隆及多语种情感调控

ZyphraAI 近日发布了其最新的多语言文本到语音（TTS）模型 Zonos-TTS，该模型基于 Apache2.0许可证，完全开源且可商用。Zonos-TTS 不仅支持实时语音克隆功能，还经过20万小时的英语语音数据训练，表现出卓越的性能。

Zonos-TTS 提供了两种部署方式:支持本地部署和便捷的 API 服务。对于普通用户，ZyphraAI 提供每月免费生成 100分钟音频的服务;专业版用户则可以选择 300分钟/5美元的套餐，超出部分按每分钟 0.02美元计费。

特别值得一提的是，实时语音克隆功能完全免费，且支持高音频质量和情感控制，为用户提供了极大的灵活性和实用性。

此外，Zonos-TTS 还支持音频前缀输入，进一步提升了其应用场景。根据 ZyphraAI 的测试，在 RTX4090显卡上，该模型能够以约 2倍实时速度运行，展现出极高的效率。此次开源发布为开发者和企业提供了一个强大且灵活的工具，助力多语言实时语音克隆技术的发展。

地址：https://huggingface.co/Zyphra/Zonos-v0.1-hybrid

如果觉得文章对你有用，请随意赞赏

快讯

ZyphraAI 发布开源 Zonos-TTS：实现实时语音克隆及多语种情感调控

破晓

2025-02-11

2025-02-11

CC BY 4.0