马斯克号称 Grok 3 的知识库是实时更新的,别被他忽悠了!

你也许听过马斯克对 Grok 3 的吹嘘:“我们的大语言模型具备实时知识,和其他家不一样。”然而,这句话背后到底隐藏着什么秘密?真的有大模型能够突破“知识库截止日期”,时刻保持最新吗?本文将为你层层揭秘,并带你了解什么是大语言模型的“knowledge cutoff date (知识库截止日期)”。

image

什么是“knowledge cutoff date”?

所谓“knowledge cutoff date”,是指大语言模型(如ChatGPT、DeepSeek、Grok等)在训练时所使用数据的最晚时间点。在此日期之后产生的信息,如果模型没有通过后续训练或联网查询,就无法直接获知。这就像一位读到某年某月的教科书后再也没有看过新资料的学生,他所掌握的知识自然会停留在那本书的出版时期。

image

马斯克的“实时”说法背后:Grok 3 真会每天训练最新知识库吗?

  1. 高昂的训练成本大语言模型的训练非常耗费资源,通常需要大规模的计算力和海量数据。因此,不可能“每天”重新训练一次,顶多也只是几个月才更新一次核心知识库。
  2. 联网查询≠实时训练即便在没有更新核心知识库的情况下,模型仍可能通过联网查询来获取更实时的内容。然而,“实时搜索”并不代表“实时训练”,因此模型本身的“基础知识”大多依然停留在初次或近期的训练数据上。

Grok 3 的“每天都是截止日期”如何实现?

与DeepSeek或ChatGPT这类大模型不同的是,Grok 3每次被问及“知识库的截止日期”时,都会回复“今天的日期”。造成这种现象的原因,暗藏在Grok系统内部的提示词(system prompt)里:

image 1. 动态加入当前日期Grok的系统提示词会自动引入当天日期,让它在回答时看上去“总是最新”的。 2. 被要求“知识持续更新”Grok的系统提示词还会明示模型:“你的知识会持续更新,并无严格的知识截止点。” 这使得它在普通模式下总是“声称”自己拥有当天的知识。

然而,当你切换到“Think 模式”并再次询问Grok 3的知识库截止日期时,它才会坦白地告诉你截止时间其实是2024年7月,也就是它最近一次训练完成的时间点。

image

“实时大模型”的正确认识

  1. 多数大模型都有截止日期无论是ChatGPT、DeepSeek还是Grok,绝大多数大模型都有各自的知识库截止时间,并并非随时训练、时时更新。
  2. “实时”更多意味着联网查询所谓的“实时知识”,大多源于模型通过接口或插件去联网搜索实时信息,而非其内在的训练数据无时无刻都在更新。
  3. 新旧信息并存使用大模型时,你可能会发现它能回答近期新闻,但又在某些方面显得“不合时宜”。这是因为模型基础知识库与联网搜索结果并存,导致对某些细节仍可能停留在老数据上。

马斯克声称的“Grok 3 知识库实时更新”听起来很先进,但拆解背后的机制,你会发现多数大语言模型其实都存在明确或隐性的知识库截止日期。所谓的“实时”更多依赖动态提示词和联网功能。要真正实现大语言模型的每天训练迭代,至少在目前的技术与成本条件下,尚不现实。