用于推理、规划和工具调用的新兴AI Agent架构的前景

微软上周的一篇论文,深入探讨了AI智能体的最新实现进展。

对 Agents 有兴可以看看,一篇论文了解 Agents 。

详细介绍了 Agents 的主要分类、定义以及设计 Agents 系统的时候需要注意的问题。

✱ Agents 的分类:

单一Agent架构:这些架构由一个语言模型驱动,并将自行执行所有推理、规划和工具执行。

多Agent架构:这些架构涉及两个或更多代理,每个代理可以利用相同的语言模型或一组不同的语言模型。这些代理可能可以访问相同的工具或不同的工具。每个代理通常有自己的人物形象。

多Agent架构又可分为垂直架构和水平架构:

垂直架构:在这种结构中,一个代理人充当领导者,其他代理人直接向他们汇报。

水平架构:在这种结构中,所有代理都被视为平等的一部分,并参与关于任务的一组讨论。

✱ 有效Agents的两个关键考虑因素:

推理和规划:

AI代理要有效地与复杂环境互动、做出自主决策并在各种任务中协助人类,它们需要强大的推理能力。

规划,需要强大的推理能力,通常分为五种主要方法:任务分解、多计划选择、外部模块辅助规划、反思和完善以及记忆增强规划。

有效工具调用:

代理抽象相对于提示基础语言模型的一个关键优势是代理能够通过调用多个工具来解决复杂问题。

这些工具使代理能够与外部数据源交互,从现有 API 发送或检索信息等。需要大量工具调用的问题通常与需要复杂推理的问题相辅相成。

原文:https://arxiv.org/abs/2404.11584