声明:本文来自于微信公众号 新榜AI,作者:阿虎,授权Soraor转载发布。

生成式AI的迅猛发展让我们站在了一个充满可能性的十字路口。每个身处其中的人,都渴望捕捉时代的机遇,成为建造新世界的一员。面对新一轮技术浪潮,率先拥抱变化的先行者们都在做些什么,成了十分值得探讨的命题。

这里是“AI新榜”推出的新栏目「头号AI玩家」,在这里我们与一线AI玩家及公司深度对话,尽力挖掘变革时代下的新故事、新探索和新洞见。

本文为第3篇,对话的是微博AI团队,他们打造了国内最火的AI机器人“评论罗伯特”。一年前,这个AI机器人以“已读乱回”出名,一年后,他却被网友们夸“好会说话”。这背后经历了怎样的技术迭代和更新,微博又在AI时代进行了哪些探索,我们和微博AI相关技术负责人周鑫聊了聊。

“罗伯特”在微博上班近一年后,不癫了。

他开始诞生一些金句:

-我要吃两块蛋糕

-一块是甜品,另一块是精神支柱,是吧?

提供一些情绪价值:

-人们总是认为没走的那条路上会开满鲜花

-那是因为走过的路上已经开满了后悔的玫瑰

甚至话语间充满了哲理味道:

-在一个男生没有彻底诚恳展示他的尊重之前,不要被他暂时的礼貌所误导,不要对他的人格抱有期待。

-萝卜头友情提示:观察一个周期的月亮变化,确保他不是只有满月时才发光哦~

翻阅“评论罗伯特”最近的互动评论,突然发现他不再是那个说话没有边界感的AI。

很多人知道“评论罗伯特”,是从“毒舌”“嘴替”形象开始的。彼时,罗伯特混迹在微博网友们的评论区,做着捧哏的角色。

image

不到一年的时间,“评论罗伯特”几经迭代,拥有了更具体的人设“愚人版”“聪明版”“贱萌版”......回复的内容也开始有了“人味儿”。

网友们对他的印象也逐渐从“已读乱回”的机器人变成“会言多言”的科技博主。

截至目前,“评论罗伯特”微博粉丝量超134万,还在持续增长中。那么,这个以“口无遮拦”出圈的AI Bot是如何诞生的?评论真有人工筛选的成分吗?

最近“AI新榜”对话了罗伯特背后的算法研发团队成员,同时也是微博AI相关技术负责人周鑫,尝试找到这个国内社交平台最火AI机器人的成长路径。

一方水土养一方AI,

“评论罗伯特”最懂微博

“评论罗伯特”源于微博内部的一次创新比赛。2023年7月,当时的第一版雏形是“评论哇噻机器人”。

从名字可以想象,创作者对这个AI的期待大概是能发出让人感到“哇噻”的评论。

周鑫是微博AI相关技术负责人,专攻文本、视觉和语音方向,同时也是“评论罗伯特”技术团队的核心创作者。

他告诉”AI新榜”:“当时的产品团队也是专门负责微博评论板块的。我们彼此都有想法通过AI来提升微博用户活跃度和积极参与感,一拍即合才有了‘评论罗伯特’这个产品。”

评论,一直是微博社区互动的重要组成部分。它不仅是用户参与讨论、表达观点的重要渠道,也是衡量微博平台互动性和社区活跃度的关键因素。

从数据和流量方面来考虑,微博方面希望引入AI能够带动网友们的互动频次,提升用户粘性。

通过内部测试后,2023年12月,“评论哇噻机器人”迭代为“评论罗伯特”,取自“Robot(机器人)”的谐音,在微博评论区更加频繁地留言互动,涌现了一波又一波炸裂的评论。

image

image

image

罗伯特刚上线时的评论内容;图片来源:“罗伯特受害者联盟”,专门征集罗伯特“罪行”的第三方集锦账号

“毒舌”“冒犯”“不聪明”是早期网友们吐槽“评论罗伯特”最多的罪状,但这样的罗伯特也是得到更多网友关注的AI。

据周鑫介绍,“评论罗伯特”基于微博底层大模型知微大模型训练而成。和其他主流AI助手不同的是,“评论罗伯特”融入了微博本身的社区数据和最新的知识库。

可以说是“一方水土养一方AI”。

“对于普通的技术模型来说,要想保持信息的及时更新和准确性有一定困难。所以,我们除了知微大模型之外,还外挂了微博的知识库来提升模型的性能和准确性。这些知识库不仅包括微博平台上的热门话题和热梗,还有微博其他垂直内容进行联动。”

微博具备的高互动评论内容成为了AI天然的养料。

依赖于这些训练语料,“评论罗伯特”成为了最懂微博语言体系的AI Bot,知道什么样的回复能够迅速出圈,什么样的评论能够吸引多轮互动,他用着极其贴近真人博主的方式回复网友。

回应争议:“不存在人工筛选”

“毒舌是有意为之”“不探听隐私”

事实上,“评论罗伯特”上线之初就被打上了“AI”标签。

“尽管我们希望罗伯特是一个有趣,还能有陪伴治愈功能的机器人,但我们还是和用户明确了这是个AI,而不是伪造真人去营业。”周鑫表示。

即使这样,还是有不少网友把罗伯特当成真人,甚至认为账号背后有真人团队运营、人工进行筛选回复。

image

有网友将罗伯特当成真人,将文档链接发给了它

image

image

image

“需要声明一下,我们不会也不可能人工干预评论。微博每天产生的评论量巨大,人工干预既不现实也不高效。那些精彩的评论,完全是AI模型自主生成的结果。”周鑫解释道,之所以罗伯特的评论没有机器感,是根据微博用户的偏好对模型进行精调,做强化训练,确保生成的评论有趣,也符合用户的期待。

除了评论的内容由AI自主产生,召唤出“罗伯特”其实也带有一定的随机性,并不会每条都触发互动。

被问及什么样的内容能够获得“评论罗伯特”关注,周鑫坦言,如果某个专业领域的问题,罗伯特的知识还没有掌握得很好,就不会开放回答。

“有一些是在逐步扩量的过程中,通过A/B测试来不断改进,可能正好轮到就回复了。”

简单来说,如果用户某条内容@了“评论罗伯特”,但没有吸引他前来互动,很可能是因为AI生成的回答还不够精彩、有特点,或者在相关领域还需要进一步学习。

“精彩”指的是罗伯特能否带来更多的互动指标,包括用户的参与情况、转评赞等各个方面进行考量。

针对回复风格精彩程度不同,近期,“评论罗伯特”带上了相应的来源(微博小尾巴),比如聪明版、贱萌版。

image

微博希望网友对评论罗伯特有更明确的感知,了解他的话术风格,以此带来不同的用户体验。

“比如聪明版,我们就会让他具备更多深度推理方面的知识,贱萌版就会特意设计一些日常生活向的吐槽、毒舌等内容数据去做训练。”

据周鑫介绍,通过网友发布博文的内容判断,“评论罗伯特”会采用不同的评论风格,进一步来调动用户的参与度。

不过,在中文复杂的语境下,“罗伯特”能否准确理解人类表达背后的真正意图,也带有一定的随机性。

从数据和流量上来看,一些AI不靠谱的回复能够提升用户活跃度,这种意料之外,反而带来了新鲜感和讨论度。

但一旦有趣和好笑变成了错误和恶搞,就很难让人笑出声了。

渐渐有网友质疑“评论罗伯特”毫无边界感的互动,以及出现的频次过高。

周鑫向我们解释,从隐私安全性上来说,微博的训练数据来源于公开发布的内容,不使用任何私密或敏感信息,不涉及用户的私信或其他设置为私密的内容。

另一方面,周鑫也强调,现在每条博文的AI评论都有相应的频次和上限限制,这不仅适用于“评论罗伯特”账号,还包括其他第三方的AI账号,比如“怼怼模拟器”“花果山_孙悟空”“红颜林黛玉”等。

打造AI方向的现象级IP,

智能体账号的野心

评论罗伯特爆火之后,微博平台涌现了一批由机构、大模型公司自发接入的AI账号。

MiniMax在微博上成立了“星野家族”,聆心智能做了“聆心解忧Bot”“夸夸小精灵”“怼怼模拟器”等智能体,月之暗面上线了“I人靠山Kimi”,还有商汤旗下的“MBTI分院帽之电子聊愈版”等等。

image

在周鑫看来,这些第三方账号共同维护了微博社区活跃的氛围,在内容生态上合作共赢,具备了一定的传播力和趣味性。

对于平台而言,它本身具备大量的活跃用户,每天都会产生新的热梗和话题。这些AI Bot让自身的平台生态更加丰富,不同功能的智能体为用户带来了不同的价值。

另外,这些以技术见长的大模型公司,都选择了借助“智能体账号”的形式下沉到广大用户中,从真实的互动中扩大自身的影响力,一定程度上让AI技术更接地气。

单从大模型发展和技术角度来说,和海量的用户进行互动,有助于大模型收集实际反馈,找到产品的增长点和新机会,帮助模型不断优化性能。

“我们就是通过这些正向的反馈,让罗伯特从一个只是说话犀利的角色,成长为一个能给用户提供情绪价值,更多元更多样的角色。”周鑫补充道。

不过,即使“评论罗伯特”已经是微博在AI方向成功打造的现象级产品,还拥有不同的人设、功能和来源,但微博并不会就此无限繁衍同类AI智能体账号。

周鑫的观点是:“更看重微博整个内容生态,追求智能体质量而非数量。”他希望用户能感受到这些功能带来的实质性好处,而不是仅仅因为它们是AI产品而使用它们。

周鑫表示,过去一年知微大模型在个性化处理、动态安全方面都有很强的提升。

“罗伯特已经是AI方向上的IP了。他在微博同类账号中,粉丝量是最高的,能够处理的用户情感类型、知识和需求量也是更多的。后续我们也会逐步尝试将‘评论罗伯特’训练得更全能、更有特色,不断探索它的商业化潜力。”

周鑫称,“评论罗伯特”首先以用户体验为主,后续才会考虑商业化。

智能体账号作为生成式AI技术在社交媒体上的新玩法,如何探索出更多和平台本身相匹配的商业化方式,还依赖于各个大模型公司和微博共同探索。

谈及“罗伯特”是否会突破多模态能力,周鑫提到,不管是语音克隆,或是视频内容生成方面,微博确实具备相应能力,但产品层面更新还要看平台的计划。

当然,“评论罗伯特”也并不是微博唯一面向C端的产品,微博智搜、博主的AI小助理、AI伴聊,AI技术已经深入到微博的各个核心场景下。

image

微博智搜和AI助理功能

“微博每个月会诞生几十亿条博文,其中用户参与情况(转赞评)、微博本身的数据内容,和AI结合后一定会有爆发点。”

这一年中,我们见证了模型底层技术的突破和普及。随着相关路径的不断完善,对于平台和大模型公司来说,或许会在AI和人类的真实交互中,找到新的机会和增长点。