Google 发布了 Gemini 2.5 Pro(I/O 预览版),这是一版专为即将到来的 Google I/O 大会提前发布的模型更新,重点提升了编码相关能力,尤其在前端开发、UI构建、函数调用、视频理解结合代码生成等方面。

主要更新:

  • 代码能力显著提升

    • 更好地支持函数调用、模块重构、逻辑判断
    • 具备“类资深开发者”的架构理解力
  • 前端与 UI 开发能力升级

    • 排名 WebDev Arena 第一
    • 自动生成美观、结构清晰的网页组件(含 CSS、响应式布局)
    • 能识别设计样式并保持风格一致性
  • 视频理解 + 代码生成融合

    • 视频内容 → 交互式应用(基于 YouTube 内容)
    • 多模态 AI 能力增强(VideoMME 评分 84.8%)
  • 构思到应用落地速度更快

    • 从简单提示快速生成具 UI + 动效的可用 App
    • 示例项目:Dictation Starter App
  • 开发体验优化

    • 错误率降低、函数触发率提升
    • 与旧版接口兼容、价格不变、无缝升级

详细升级介绍

1. 🚀 代码能力升级

  • 更强的代码生成与重构能力:

    • 在涉及复杂后端重构任务的评测中,首次成功通过 Cognition 的高级开发者评测用例,展示出“类资深开发者”水平的抽象与结构选择能力;
    • 适用于复杂业务逻辑调整、模块化设计、API重写等任务。
  • 更可靠的函数调用能力(Function Calling):

    • 错误率下降,触发率提升,开发者可以更流畅地构建基于多步骤函数组合的“Agentic Workflow”;
    • Gemini API 接入的开发者无需迁移,系统自动切换到新版。


2. 🧑‍💻 前端开发支持全面增强

Gemini 2.5 Pro 在前端开发领域已跃居 WebDev Arena 排名第一(衡量人类偏好度的排行榜)。

可用于以下典型任务:

  • 将设计图转为实际网页组件(HTML + CSS + JS);
  • 快速生成 UI 组件并自动适配现有样式;
  • 理解按钮交互、字体、边距、动画等视觉元素,并还原成高质量网页;
  • 模仿现有应用风格实现新功能(如将视频播放器嵌入现有网页)。

🎯 示例:在 Gemini 95 Starter App 中,开发者只需描述“想要增加一个样式统一的视频播放器”,Gemini 就能自动读取已有设计风格并生成可用组件。

3. 🎥 视频+代码:多模态能力进一步融合

  • 在 VideoMME 基准上得分高达 84.8%,是目前领先的“视频理解大模型”之一;
  • 可基于一段 YouTube 视频,自动生成交互式学习 App,包括内容提取、界面构建与逻辑生成;
  • 代表 AI 正从“语言驱动代码”进化为“视频驱动产品”的多模态阶段。

📌 示例:Google AI Studio 的 Video to Learning App 演示了这种新能力。


4. ✨ “从构思到产品”的开发流程加速

借助 Gemini 2.5 Pro,开发者能快速将一个产品想法实现为具备完整功能与视觉质量的 App。

示例产品:“Dictation Starter App”:

  • 自动生成麦克风动画、响应式布局、按钮悬停特效
  • 不仅满足功能需求,视觉表现也高度专业;
  • 表明模型具备基础审美感知与产品意识。

现在你可以通过 Google AI Studio 中的 Gemini API 选择 Gemini 2.5 Pro(05-06) 进行构建应用,企业客户可以使用 Vertex AI 构建。

  • 目前 Gemini 2.5 Pro 预览版以与旧版(03-25)相同的价格开放使用
  • 系统已默认将接口指向新版(05-06),开发者无需额外迁移;
  • 模型卡已同步更新,记录各项升级细节。