谷歌云在位于伦敦的 DeepMind 总部举行了一场会,正式推出其高清语模型 Chirp3。该模型通过 Vertex AI 统一机器学习平台向开发者开放,提供了丰富的开发工具,助力程序的创新。
Chirp3支持248种不同的声音,并可用31种语言进行语音合成。开发者可以利用这一模型创建多种应用,如智能语音助手、有声读物和视频配音等。谷歌表示,Chirp3的语音功能能够捕捉人类语调的细微差别,使得对话更加生动和引人入胜。
除了使用现成的语音,用户还可以通过谷歌云的文本转语音 API 创建自定义语音。然而,谷歌为了确保负责任的使用,限制了这一语音克隆功能的访问权限,以防止潜在的滥用行为,并确保符合伦理 AI 的实践。
在发布会上,谷歌云首席执行官托马斯・库里安(Thomas Kurian)强调,谷歌的总体愿景是提供一系列广泛的模型,除了 Chirp3外,还包括 Gemini、Imagen、Veil 等多款产品。谷歌还推出了一个名为 Agent Space 的新产品,专为商业用户设计,以满足其特定需求。
谷歌 DeepMind 的首席执行官德米斯・哈萨比斯(Sir Demis Hassabis)也介绍了 Gemini 的演进,尤其是其多模态理解能力。他提到,在 AI Studio 中,用户可以发布 YouTube 链接,Gemini 能够处理视频内容,利用其长时上下文窗口让用户提问,快速找到讲座或体育赛事的关键时刻。
此外,谷歌还借此机会宣布了一项计划,旨在通过综合培训项目来提升英国的 AI 技能,帮助专业人士有效掌握 AI 技术。谷歌将向英国初创企业提供云基础设施和 AI 工具的使用积分,支持它们快速开发和扩展创新解决方案,以刺激创业活动。
在隐私和合规性方面,谷歌重申了对数据驻留的承诺,其 Vertex AI 和 Agent Space AI 工具可以帮助组织在符合当地法律的情况下,进行模型的训练和服务。这一点对于医疗和金融等行业至关重要,因为这些领域对隐私和合规性要求极高。
项目:https://cloud.google.com/text-to-speech/docs/chirp3-hd
划重点:
🌟 谷歌云推出 Chirp3语音模型,支持248种声音和31种语言,助力开发者构建智能应用。
🔒 谷歌限制语音克隆功能的访问权限,以确保伦理 AI 的实践和防止滥用。
💼 谷歌发起计划提升英国 AI 技能,并向初创企业提供云基础设施支持,促进创新。