ElevenLabs 发布了全新一代语音生成工具 Voice Design v3,允许用户通过文本提示词创建符合角色设定的个性化语音。

  • 新版本模型具备更高音质、更丰富的表达力。
  • 支持 70+语言 和数百种本地口音,适合制作级用途。
  • 重大更新包括:

    • 对语音角色的个性和韵律(如语气、语速、语调变化、年龄和性别)拥有更细致控制;
    • 支持 Eleven v3 和新音频标签;
    • 提升口音识别处理;
    • 更高保真音频输出;

Voice Design v3 支持 70 多种语言及多种地方口音,适合各种创意和商业用途。官方展示了多个生动的案例,包括日式战士、女巫、法式女声和滑稽外星人等角色,展示了系统的灵活性和表现力。

该功能现已面向所有用户开放。

在线体验:https://elevenlabs.io/voice-design

🎨 功能详解

📝 1. 基于描述的语音生成

你只需输入一段描述性文字,系统即可即时生成相应的语音。例如:

  • 示例 Prompt

    “一个平静、坚毅又粗哑的老牛仔,带有浓重的美国南方口音。”

  • 生成语音

    “Well, I'll be damned. [laughs] Looks like it's just me and you left…”

它可以解析Prompt 中涉及的情绪、语气、年龄、背景、口音等信息,从而生成拟人化语音。


🎛️ 2. 高度可调节参数

用户可以自定义以下语音特性:

🧠 3. 模型支持的角色风格

Voice Design 支持创造多种语音风格,无论是写实还是幻想:

  • 真实风格:

    • “一个20岁的印度女性,声音高、柔和,说话慢且温和。”
    • “中年英国男性,声音有磁性,正式且清晰。”
  • 角色风格:

    • “一个粗鲁、愤怒的老海盗,常常大喊大叫。”
    • “一个外星人,声音尖锐、咯咯作响、带有搞笑口癖。”

📚 4. 使用指南与提示库(Prompting Guide)

为了帮助用户更好地设计语音,ElevenLabs 提供了专门的提示语写作指南,其中包括数十种风格模板、构建技巧、最佳实践,让新手也能轻松开始创作。


⚙️ 5. 语音设计 API(开发者功能)

Voice Design 提供 API 接口(目前 Alpha 阶段,仅限控制台使用):

  • 生成接口:输入 prompt 和文本,即可返回语音预览。
  • 保存接口:将生成的语音保存到用户语音库中。

适用于产品集成、自动化创作、个性化内容生成等开发者场景。

Voice Design v3示例:

声音提示:
A calm, tough and gruff old cowboy with an deep, gravelly, southern American accent.
语音提示:一位非常年长、脾气暴躁且声音嘶哑的非裔美国祖母,80岁。声音非常沙哑、易怒、尖锐且充满挫败感。


声音提示:

A calm and husky make warrior with a thick Japanese accent. Soft, whiskery, low tone with a composed and gentle pacing.
一个冷静而沙哑的战士男性,带浓重的日式口音。声音柔和、低沉,语速平稳温和。


声音提示:

A scary old and haggard witch who is sneaky and menacing. She has a croaky, harsh, shrill, high-pitch voice that cackles.
一位年老憔悴、狡猾又吓人的女巫,声音沙哑刺耳,尖细高亢,还带着咯咯笑声。


声音提示:

A low, whispery and assertive female voice with a thick French accent. Cool, composed and seductive, with a hint of mystery.
一个声音低沉而坚定的女性,带浓重法式口音,冷静、性感且神秘。


声音提示:

Greetings, earthlings. I must say your voice models are out of this world!
一个来自外太空的有趣外星人,声音荒谬且令人讨厌,总是带着一点含糊不清的傻乎乎的高音调。


声音提示:

The friendly mythical God, Zeus, with a huge deep powerful voice. Charming, proud, strong and theatrical.
友善的神话之神宙斯,拥有巨大的深沉有力的声音。迷人、自豪、强壮且富有戏剧性。


声音提示:

A very old, cranky and croaky African-American grandma. 80 years old. Very hoarse, grumpy, shrill and frustrated.
一位非常年长、脾气暴躁且声音嘶哑的非裔美国祖母,80岁。声音非常沙哑、易怒、尖锐且充满挫败感。