信息差

Google重磅发布AlphaEvolve：首个能自主编码、测试并迭代进化的AI代理

Google DeepMind发布了一种全新的 AI 编码代理：AlphaEvolve，它可以自动优化算法并进行科学发现

AlphaEvolve 的核心定位是：

一个基于大语言模型（LLMs）+ 进化算法 + 自动评估器的通用算法发现与优化平台。

它不仅能写代码，还能自动评估这些代码的表现，然后根据评估结果调整策略、迭代生成更好的方案。这一过程本质上是模拟“算法自然进化”。

它厉害在哪里？

不需要人类一步步写优化方案，它自己想改法、自己测试、自己改进。
比其他AI更强的是，它可以修改整段程序，不是只改一两个小函数。
它能学会在不同问题下用不同策略，比如复杂问题用搜索算法，结构化问题用构造法。
成果已经真实投入Google大规模生产使用，不是实验室玩具。

可以理解为它是一个超级“AI程序员”，它能：

自动写代码解决复杂问题；

自己测试自己的代码；

如果效果不好，自动改进并尝试新方法；

最终像“进化论”一样，筛选出最优秀的算法方案。

它已经被用在：

提高谷歌数据中心效率；

加速AI模型训练；

帮助数学家解决难题；

甚至给芯片设计师提供Verilog代码建议！

举个例子！

它解决了一个50多年没人改进的问题——如何最有效地做“4×4矩阵乘法”。旧方法需要49次乘法，它发现了只用48次的新方法！

AlphaEvolve 与以往 AI 系统的根本区别

通用性：

与 DeepMind 之前的 AlphaFold（专为蛋白质折叠）或 AlphaTensor（专为矩阵乘法）不同，AlphaEvolve 是通用 AI，可应用于任何可表达为代码且可自动评估的问题。
其“搜索算法而非直接搜索解”的方法使其适用于广泛领域，从数学到系统优化。

工作机制详解

AlphaEvolve 不是简单地依靠单一语言模型完成任务，而是一个多组件、多阶段联动系统，包含以下核心模块：

系统结构

AlphaEvolve 的整体流程由多个模块组成，彼此协同构建了一个 进化式自动算法设计系统：

1. 输入阶段

用户提供：

初始程序代码；
需要优化的问题定义；
自动化评估函数（如代码性能、输出正确性等）。

2. 核心模块构成

🧩 Prompt Sampler（提示构建器）

组合历史优秀方案 + 问题上下文，构建复杂 prompt；
支持人类提供的背景知识、公式、代码片段等；
还能生成“元提示”（meta-prompts）来优化生成质量。

🤖 LLM Ensemble（LLM集成）

使用 Gemini Flash 快速生成大量候选程序；
使用 Gemini Pro 深度优化关键建议；
共同驱动“进化”过程，提出多样化代码修改建议。

🧪 Evaluators（自动评估器）

自动运行并评估每个程序在任务中的表现；
支持多指标优化、级联评估、并行分布式执行；
可附加 LLM 辅助判断（如程序可读性、简洁性等）。

📦 Program Database（程序数据库）

储存历史方案、评估分数、修改记录；
用于构造新一代 Prompt，实现类似“遗传记忆”的演化。

进化算法（Evolutionary Loop）

AlphaEvolve 的核心是 LLM驱动的“进化式搜索”：

选择一个“父程序”，从数据库中提取其最优结构；
通过 Prompt 构建当前任务和上下文；
LLM 生成新的代码差异（diff）；
应用差异形成“子程序”；
用评估器跑结果、打分；
如果子程序优于父程序，入库，下一轮进化继续。

这一过程不仅演化代码，还可以演化 prompt 本身、评价指标等，实现高度自适应的搜索优化。

将表现最好的代码片段“保留下来”，用于下一轮生成的输入；
系统也会引入“变异”——对已有代码进行小幅调整尝试新解；
这一过程会不断迭代优化，直至产生最优解或新颖有效的算法。

已落地的应用与成果

AlphaEvolve 已不只是研究原型，而是已经部署在真实生产系统中并产生了明显成效。几个关键应用场景如下：

✅ 数据中心调度优化（Google Borg 系统）

为 Google 的 Borg 集群管理系统设计了一种调度启发式算法，已投入使用超一年，可持续回收约 0.7% 的计算资源
解决了“搁浅资源”问题（例如内存耗尽但 CPU 仍可用）。
生成的代码简单且人类可读，便于工程师调试和部署。

✅ AI 芯片设计协同（Verilog级别）

对 Google TPU 中的某个矩阵乘法电路进行了 Verilog 级别的重写，去除冗余位，保持功能正确性；
这一建议已被采纳进入未来一代芯片设计流程中，显著节省面积与能耗。

✅ AI 模型训练加速（包括 Gemini 自身）

优化了 Gemini 模型训练中的矩阵乘法内核，加速 23%，整体训练时间缩短 1%，在 Google 的计算规模下节省了大量能源和资源。
对 FlashAttention 内核的低级 GPU 指令进行重构，速度提升达 32.5%。

✅ 数学与算法发现

在 50 个数学问题（涵盖几何、组合数学等领域）的测试中，AlphaEvolve 在 75% 的情况下重现了已知最优解，在 20% 的情况下发现了优于已有解的新解。
接触球数问题：在 11 维空间中，将接触球数（非重叠单位球体可同时接触中心球体的数量）的下界从 592 提高到 593，打破了现有记录（上界为 868）。
矩阵乘法：发现了比 1969 年 Strassen 算法更高效的 4×4 复数矩阵乘法算法，减少了标量乘法次数，提升了计算效率。

官方介绍：https://deepmind.google/discover/blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/

技术报告

如果觉得文章对你有用，请随意赞赏

快讯

Google重磅发布AlphaEvolve：首个能自主编码、测试并迭代进化的AI代理

https://soraor.com/archives/ai-today_20250515121257

作者

破晓

发布于

2025-05-15

更新于

2025-05-15

许可协议

CC BY 4.0