ZyphraAI 近日发布了其最新的多语言文本到语音(TTS)模型 Zonos-TTS,该模型基于 Apache2.0许可证,完全开源且可商用。Zonos-TTS 不仅支持实时语音克隆功能,还经过20万小时的英语语音数据训练,表现出卓越的性能。

Zonos-TTS 提供了两种部署方式:支持本地部署和便捷的 API 服务。对于普通用户,ZyphraAI 提供每月免费生成 100分钟音频的服务;专业版用户则可以选择 300分钟/5美元的套餐,超出部分按每分钟 0.02美元计费。

特别值得一提的是,实时语音克隆功能完全免费,且支持高音频质量和情感控制,为用户提供了极大的灵活性和实用性。

此外,Zonos-TTS 还支持音频前缀输入,进一步提升了其应用场景。根据 ZyphraAI 的测试,在 RTX4090显卡上,该模型能够以约 2倍实时速度运行,展现出极高的效率。此次开源发布为开发者和企业提供了一个强大且灵活的工具,助力多语言实时语音克隆技术的发展。

地址:https://huggingface.co/Zyphra/Zonos-v0.1-hybrid