1️⃣ Veo 2(视频生成)功能升级

  • 🔧 视频编辑工具上线

    • Inpainting:逐帧去除视频元素(如背景Logo)

    • Outpainting:扩展画面边界,适配多种屏幕比例(如横转竖)

    • 镜头控制:设定角度、时间流、摄影机轨迹(如航拍感)
    • 帧插值(interpolation):连接两个片段,平滑过渡

  • 🎯 从“生成工具”升级为“视频创意平台”
  • 🧪 案例:将达利1937年未实现的剧本《Giraffes on Horseback Salad》通过 Veo 2 实现成影片

2️⃣ Imagen 3(文本生成图像)增强

  • 🖌️ 新能力:

    • 物体去除 + 区块修复(inpainting)

    • 图像细节、光影提升,极大减少伪影
  • 🎯 用于广告、产品、网页内容创作
  • 🧪 应用:L’Oréal、Kraft Heinz 用于全球市场图像内容制作,支持 20+ 国家语言

3️⃣ Lyria(文本生成音乐)首次开放

  • 🔥 Vertex AI 首个 AI 作曲模型
  • 🎼 特点:

    • 高保真(Hi-Fi),捕捉音乐细节
    • 支持多风格(电子、古典、爵士等)
    • 可精确控制速度、配器、氛围、节奏
  • 💼 用途:

    • 为视频创作专属配乐
    • 自动生成品牌声标识(sonic branding)
    • 减少音乐授权成本与创作时间

示例 Prompt:

“生成一段高强度 Bebop 爵士乐,以高速的萨克斯和小号独奏主导,背景钢琴提供和弦伴奏,低音贝司和鼓快速交替,营造深夜爵士俱乐部氛围。”


4️⃣ Chirp 3(语音生成 + 语音理解)强化

✨ 新功能:

  • 🗣️ Instant Custom Voice

    • 输入 10 秒语音,生成个性化配音模型
    • 用于客服系统、品牌语音、无障碍阅读
  • 📝 Transcription with Diarization

    • 转录+区分不同发言者(多讲者会议摘要、播客分析)

✅ 覆盖 35+ 种语言 + 8 种发音风格
✅ 所有合成语音配备安全使用验证机制

Vertex AI 已全面支持四大多模态生成模型

Vertex AI 成为唯一同时支持「图 + 音 + 乐 + 视频」全链条生成的企业平台。

官方介绍:https://cloud.google.com/blog/products/ai-machine-learning/expanding-generative-media-for-enterprise-on-vertex-ai