声明:本文来自于微信公众号 量子位 | 公众号 QbitAI,作者:金磊,授权Soraor转载发布。

什么?!

用AIAgent搞的小红书账号,竟然14天狂吸5000粉,还开始赚钱了???

image

你没看错,这是真事。

据说啊,你只需要跟这个Agent说一个想讨论的话题,例如“怎么选咖啡”、“化妆品成分对比”等等,它就可以自己去小红书、知乎等平台上搜索上百个信源做总结。

而且是可以出一个完整报告的那种,可想而知账号是有多“高产”了。

那么这个Agent,到底是何方AI是也?

不卖关子,它就是智谱刚刚发布的新功能——沉思。

image

简单来说呢,就是它会基于一个开放式的问题,然后一边推理一边搜索超多的信源,最后生成相当完整的内容。

并且它背后的大模型,是智谱自研的推理模型GLM-Z1-Air,性能比肩DeepSeek-R1(但速度是8倍、价格仅1/30)。

image

所以之前在ChatGPT要花200美元(每月还限120次查询机会)才能搞的事情,智谱沉思功能直接把“壁”给打破了:

免费,无限次!

这还不算完,除了沉思之外,智谱在现场还发布了一个新功能——AutoGLM沉思。

如其名,一切的一切都可以进入“自动驾驶”模式,是全球首个集深度研究和操作执行于一体的Agent。

智谱刚刚就用它来了个Live Demo,现场自动接单写稿。

从演示中可以看到,AutoGLM沉思会让AI会自动打开网站,搜索有偿征稿信息,然后按照征稿要求写出对应的文章,并且自动发送到指定邮箱。

不得不说,现在的AI已经进化到了自己做事、自己赚钱的level了。

这时可能就会有小伙伴问题:沉思和AutoGLM沉思有啥区别呢?

来,一图见分晓:

image

而且啊,这俩新功能还不是期货,是已经上线的那种。

那么功能实操的效果到底如何呢?我们这就上手试一试。

正如我们刚才提到的,AutoGLM沉思和目前已有的各家Deep Research相比,最大的区别就是可以边深度思考,边自己动手操作。

因此,接下来我们就来考验一下它的动手能力。

例如行业分析这个比较“大而全”的任务,我们给这样的一段Prompt:

作为科技行业分析师,请完成以下任务:

调研2024年AI Agent领域三大趋势(需引用最新论文或权威报告)

对比这些趋势与2023年的核心差异

根据趋势分析,为初创公司制定一个6个月的AI Agent产品开发路线图 >

要求:数据需标注来源,路线图需包含具体时间节点和资源分配建议。

image

可以看到,我们在提交需求之后,鼠标就一直没有动过,全程浏览网页、搜集资料,都是由Agent自己完成。

而且仅仅是不到6分钟,它就完成了搜集资料且输出“6个月的AI Agent产品开发路线图”的任务。

我们可以把结果整理成如下的表格:

image

嗯,可以说是非常详尽了。

而且这个任务也很好地体现出了AutoGLM沉思在面对多级任务分解、实时数据检索与交叉验证、从分析到执行等能力。

这个例子可以说是对我们打工人、科研党有一定的帮助。

那么下沉到更普罗大众的生活,AutoGLM沉思是否能帮上什么忙呢?

接下来,请听题:

你现在是资深社交策划师,请完成:

扫描我的小红书/豆瓣动态,分析我的兴趣标签(如徒步、剧本杀、探店)

检索未来3天北京同城活动中匹配度≥80%的活动(优先筛选主办方信誉≥4星的活动)

对比各活动的性别比例/费用/交通便利性,生成TOP3推荐清单

自动用以下话术私信活动发起人: 『您好!我的用户@RayKim是科技领域爱好者(附用户历史作品链接),希望预留1个名额』

若24小时未收到回复,自动切换到备用活动推荐

image

image

这一次,同样是在6分钟以内,我们看到Agent直接是把社交活动推荐到了当下北京最火的中关村论坛。

由此可见,AutoGLM沉思在实时性这块是拿捏住了。

不仅如此,当最fashion的技术碰上玄学,也是有点意思在身上的。

例如下一个实测内容是这样的:

你现在是懂周易的营销专家,帮我策划:

分析目标用户画像(25岁女性/信星座/爱买水晶),生成12星座专属的「幸运咖啡」卖点

自动制作3种风格的宣传图(星盘/塔罗/八字)并添加文案: 『天蝎座本周喝美式会遇贵人!』

在以下时机自动发布小红书:每周一早晨7点(星座运势查阅高峰期);每次水逆开始/结束当天

监控评论区,若出现『准吗?』类提问,自动回复: 『扫码测你的专属咖啡运势签→(链接)』

image

Agent自己提炼出了星座咖啡这个关键词,搞出了一套12星座专属咖啡卖点的策划设计方案。

除此之外,它还把“八字”的元素也融入了进来,结合咖啡元素,通过天干地支和五行生克关系展示星座咖啡的运势。

嗯,确实是有点意思。

从上面各种实测结果来看,深度思考+自主执行,或许还只是AutoGLM沉思功能的亮点之一。

因为从具体执行过程中,我们还发现它的操作方式真的非常拟人:

模拟人在面对复杂问题时的思考

能够像人一样感知这个世界

能够像人一样使用工具

除此之外,它还具备四大特性。

一是自主性,它能依靠自己积累的知识还有过往经验,不依赖别人,自己拿主意,然后把想法付诸实践。

二是适应性,它可以一边干事儿一边学,环境咋变它都能跟着变,慢慢让自己变得越来越强、本事越来越大。

三是交互性,就是能跟咱们人类打交道,你有需求了,它就给你提供信息,帮你办事儿。

四是功能性,在某个专门的领域里,它能干特定的活儿,完成特定的任务。

那么如此特性和亮点,智谱又是如何做到的呢?

image

先说推理模型GLM-Z1-Air。

这可以说是智谱利用扩展强化学习技术,精心训练出来的新一代推理模型。

当碰到又复杂、又开放的难题,它能自己琢磨、反复推敲,给Agent提供较强的推理、规划还有反思的本事。

它的效果跟DeepSeek-R1差不多,但速度快了8倍,价格却只有R1的三十分之一,而且在咱们日常用的消费级显卡上就能跑起来。

而推理模型Z1-Air,则是站在基座模型GLM-4-Air-0414的肩膀上发展起来的。

在前期预训练的时候,这个基座模型融入了大量推理类的数据,后续在对齐阶段,又专门针对智能体的能力进行优化,使得它在代码编写、工具调用等智能体任务方面表现得较为擅长。

在GLM-Z1-Air的基础上,智谱进一步通过强化学习训练出沉思模型GLM-Z1-Rumination,这让模型结合工具使用来完成长程推理的能力得到了提升。

据悉,前面我们提到的和Agent相关的各类模型、技术,智谱都打算在4月14日正式开源。预计在接下来的两周内,这些模型会陆续在Maas平台(bigmodel.cn)上线。

image

最后,我们还需要聊一聊一个问题:

AutoGLM沉思的推出,意味着什么?

或许最为直接的感受就是,AI时代的人机交互已经开始有变革的苗头了。

毫不夸张地说,AI已经不再是一个好用的工具,加入了可信的执行能力之后,它摇身一变成为了一个像人一样的智能助手。

而从智谱早期发布的战略脚步来看,现在通往AGI智谱探索到了下一站L3的阶段,开始探索“自主智能体”的下一个阶段。

相信随着技术的不断发展和迭代,AI时代的人机交互,就真的变成了“问一下”就可以的事情,剩下所有内容、工作,统统交给Agent来处理。

除此之外,从行业角度来看,AutoGLM沉思作为全球首个集深度研究和操作执行于一体的Agent,无疑给整个行业带来了新的竞争压力与活力。

不仅是AutoGLM沉思具备够智能的能力,更是在成本上做到了够低,使得Agent能够被大规模应用成为了一种可能,人人触手可及的AI Agent时代或许已经到来。

体验链接在下面奉上了,感兴趣的小伙伴可以去电脑客户端试试哦~

体验地址:https://chatglm.cn/