Google 发布了 Gemini 2.5 Pro 的升级预览版,版本将在未来几周内作为**企业级通用可用版本(GA)**推出
“更聪明、更快、更稳、更有创意。”
这是 Google 对其新一代大模型 Gemini 2.5 Pro 的定位。它不仅在多个 AI 排行榜中登顶,还首次为开发者开放「思考预算」功能,让 AI 不再是“黑箱”,而是可控、可定制的智能工具。
性能继续跃升
最新的 Gemini 2.5 Pro 模型在多个权威评测中取得了显著进展:
- 在语言理解能力评测平台 LMArena 上,Elo 分数上升了 24 点,达到 1470 分,继续稳居排行榜首位;
- 在 Web 编程能力测试 WebDevArena 中,分数上升了 35 点,达到 1443 分,同样位居第一;
- 在编码能力方面继续保持领先,特别是在高难度多语言编程测试 Aider Polyglot 中表现优异;
- 同时在 GPQA 和 Humanity's Last Exam(HLE) 等严苛的综合性测评中也展现了顶级水平,这些测评主要考察模型在数学、科学、常识与推理等方面的能力。
- 语言理解与对话能力(LMArena 第一)
- 网页编程与前端开发能力(WebDevArena 第一)
- 复杂、多语言代码生成能力(Aider Polyglot)
- 学术/推理类问题解决能力(GPQA + HLE)
响应风格优化
Google 针对用户反馈,特别优化了模型的表达风格和格式控制能力:
- 更有条理的结构:回答更清晰,适合生成报告、说明书、教程。
- 更强的创意表达:支持文学风格、内容改写、广告文案等多样需求。
- 响应格式更专业:可生成带结构的列表、代码块、引用,更适用于工程场景。
这意味着,Gemini 不只是“会说话”,而是懂你要做什么,并且给出更可用的内容结果。
新增功能:「思考预算(Thinking Budgets)」
这个新特性是目前 Gemini 独有的控制机制,意味着:
- 你可以自定义每次调用 AI 时“思考多少”(计算资源消耗);
- 平衡 生成质量、响应时间与成本;
- 非常适合做工具类产品、成本敏感应用。
接入方式
开发者现在可以通过以下两种方式接入 Gemini 2.5 Pro:
- Google AI Studio
- Vertex AI(Google Cloud)
- Gemini 2.5 Pro 已集成进 Gemini 应用(Android / iOS / Web)