信息差

Podcastle 发布革命性AI文本转语音技术：450种语音任你选

在快速发展的播客领域，Podcastle 平台近日宣布推出其全新的 AI 文本转语音模型 Asyncflow v1.0。这个新模型不仅为用户提供了超过450种不同的 AI 语音，还向开发者开放了 API 接口，以便于他们将这一文本转语音功能直接集成到自己的应用程序中。

Podcastle 的创始人 Arto Yeritsyan 表示，公司一直希望能开发一个文本转语音模型，但由于过去高昂的训练成本和数据需求，这一愿望一直未能实现。然而，随着近年来大型语言模型技术的进步，Podcastle 终于在去年取得了突破，能够在不需要大量数据的情况下，构建出高质量的语音模型。Yeritsyan 补充道，Podcastle 的研发得到了去年1350万美元的 A 轮融资的支持，这为其技术创新提供了重要保障。

在价格方面，Podcastle 的文本转语音服务定价为每500分钟约40美元，相比之下，竞争对手 ElevenLabs 则收取99美元。除了文本转语音模型外，Podcastle 的语音克隆功能也得到了升级，训练过程由之前的需朗读70句不同句子，缩短至现在仅需几秒的录音。新过程利用了 Podcastle 去年推出的 Magic Dust AI 技术，显著提高了音频录制质量。

在实际测试中，尽管新生成的语音听起来稍显机器人，但仍能较好地模仿说话者的语调。Podcastle 表示，随着时间推移，该功能将不断改进，用户也可以通过不同的录音样本训练出不同的声音效果。

Yeritsyan 指出，除了成本优势外，将音频、视频、播客和 AI 驱动的叙述工具整合到一个重新设计的网站中，也将使 Podcastle 在竞争中脱颖而出。他提到，虽然大多数用户仍主要使用 Podcastle 进行音频内容创作，但视频制作的需求也在逐渐上升。

入口:https://podcastle.ai/ai-voices

划重点:

🌟 Podcastle 推出 Asyncflow v1.0模型，提供超过450种 AI 语音。

💰 该平台每500分钟文本转语音的收费为40美元，低于竞争对手的定价。

🎤 语音克隆功能经过升级，训练时间大幅缩短，用户体验不断优化。

如果觉得文章对你有用，请随意赞赏

快讯

Podcastle 发布革命性AI文本转语音技术：450种语音任你选

https://soraor.com/archives/ai-today_20250304112631

作者

破晓

发布于

2025-03-04

更新于

2025-03-04

许可协议

CC BY 4.0