近年来,以ChatGPT为代表的大语言模型掀起了 AI 领域的新浪潮。这些强大的语言模型不仅能理解人类指令,还能制定计划、探索环境并利用工具解决复杂任务,展现出在机器人、个人助理和流程自动化等领域的巨大潜力。

image

然而,现有的 AI 智能体系统大多是被动的,需要明确的人类指令才能执行任务,想要安排个会议,还得手动输入时间、地点,甚至连参会人员都得一一列出来,简直比自己动手还麻烦!

试想一下,当你收到一封来自同事的电子邮件,建议召开一次会议,一个被动的 AI 智能体会等待你明确指示它安排会议。而一个主动的 AI 智能体则会注意到这封邮件,并主动提出安排会议的请求。这种主动性不仅大大减轻了用户的认知负担,还能识别出人类未明确表达的潜在需求。

image

为了解决AI助手太被动的问题,清华大学和面壁智能强强联手,提出了一种全新的AI智能体,它不再是“言听计从”的机器,而是能“未卜先知”,在你还没开口之前,就主动帮你把事情安排得明明白白!

这个“神奇”的AI智能体是如何做到的呢?秘密武器就是 ProactiveBench 数据集!这个数据集就像一本记录了人类各种活动的“百科全书”,里面包含了你在电脑前敲下的每一个字母、点击的每一个链接,甚至连你复制粘贴的内容都记录得清清楚楚!

image

利用这个数据集,研究人员训练了一个 奖励模型,它就像一个“模拟人类大脑”的超级计算机,能够判断AI智能体的行为是否符合人类的预期。如果AI智能体表现出色,就会获得奖励,反之则会被扣分。经过反复训练,AI智能体就能像人类一样,根据你的行为预测你的需求,并在你需要的时候主动提供帮助。

举个例子,当你收到一封来自同事的邮件,建议召开一次会议,这个“未卜先知”的AI智能体就会自动识别邮件内容,并主动询问你是否需要安排会议。如果你同意,它就会自动帮你安排时间、地点,甚至还会帮你发送会议邀请!是不是比现在的AI助手“聪明”多了?

实验结果表明,使用 ProactiveBench 数据集 训练的AI智能体表现非常出色,例如,Qwen2-7B-Instruct 模型 在主动提供帮助方面的 F1得分 高达66.47%,超过了所有开源和闭源模型!

虽然这个“未卜先知”的AI智能体还处于研究阶段,但它为未来人机协作的进步带来了新的希望。相信在不久的将来,我们就能拥有一个真正“懂你”的AI助手,它不仅能“言听计从”,还能主动帮你解决各种问题,让你的生活更加轻松便捷!

论文地址:https://arxiv.org/pdf/2410.12361