1️⃣ Veo 2(视频生成)功能升级
🔧 视频编辑工具上线:
Inpainting:逐帧去除视频元素(如背景Logo)
Outpainting:扩展画面边界,适配多种屏幕比例(如横转竖)
- 镜头控制:设定角度、时间流、摄影机轨迹(如航拍感)
帧插值(interpolation):连接两个片段,平滑过渡
- 🎯 从“生成工具”升级为“视频创意平台”
- 🧪 案例:将达利1937年未实现的剧本《Giraffes on Horseback Salad》通过 Veo 2 实现成影片
2️⃣ Imagen 3(文本生成图像)增强
🖌️ 新能力:
物体去除 + 区块修复(inpainting)
- 图像细节、光影提升,极大减少伪影
- 🎯 用于广告、产品、网页内容创作
- 🧪 应用:L’Oréal、Kraft Heinz 用于全球市场图像内容制作,支持 20+ 国家语言
3️⃣ Lyria(文本生成音乐)首次开放
- 🔥 Vertex AI 首个 AI 作曲模型
🎼 特点:
- 高保真(Hi-Fi),捕捉音乐细节
- 支持多风格(电子、古典、爵士等)
- 可精确控制速度、配器、氛围、节奏
💼 用途:
- 为视频创作专属配乐
- 自动生成品牌声标识(sonic branding)
- 减少音乐授权成本与创作时间
示例 Prompt:
“生成一段高强度 Bebop 爵士乐,以高速的萨克斯和小号独奏主导,背景钢琴提供和弦伴奏,低音贝司和鼓快速交替,营造深夜爵士俱乐部氛围。”
4️⃣ Chirp 3(语音生成 + 语音理解)强化
✨ 新功能:
🗣️ Instant Custom Voice:
- 输入 10 秒语音,生成个性化配音模型
- 用于客服系统、品牌语音、无障碍阅读
📝 Transcription with Diarization:
- 转录+区分不同发言者(多讲者会议摘要、播客分析)
✅ 覆盖 35+ 种语言 + 8 种发音风格
✅ 所有合成语音配备安全使用验证机制
Vertex AI 已全面支持四大多模态生成模型
Vertex AI 成为唯一同时支持「图 + 音 + 乐 + 视频」全链条生成的企业平台。