信息差

GPT-4.5六小时神话破灭，xAI Grok-3强势登顶！

OpenAI 的 GPT-4.5模型在刚刚发布后的六小时内，成功登顶人工智能竞技场，并成为全任务分类的第一名。然而，这一荣耀并未持续太久，马斯克的 xAI Grok-3模型迅速逆袭，反超成为总榜第一名。

根据投票数据显示，GPT-4.5与 Grok-3各自获得超过3000票，最终总分为1412对1411，仅差一分。尽管 GPT-4.5在大多数项目上表现优秀，但 Grok-3在特定的 “带风格控制” 和 “困难提示词” 任务上略有优势，这使得它在总分上实现了反超。

对于这场 “六小时逆转”，不少用户表示怀疑，认为如此迅速的变化是否合理。对此，有业内人士解释称，竞争榜单设有投票门槛，只有在同一时间内达到3000票的模型才能登上榜单。因此，刚刚发布不久的这两款模型能够同步达到该标准，是一场巧合的结果。

值得一提的是，尽管 GPT-4.5刚发布时面临着一些负面评价，用户对于其高情商的认可度却在日后显著上升。OpenAI 的首席执行官萨姆・奥尔特曼甚至分享了与 GPT-4.5的对话，表示这是他首次收到用户请求其承诺不再下架该模型。

与此同时，GPT-4.5还在一项另类竞赛中取得了优异表现，参与了一场类似于 “大模型狼人杀” 的游戏。在这场比赛中，各大 AI 模型需进行辩论、策略制定与投票，最终的胜者由被淘汰的成员组成的陪审团决定。GPT-4.5在合作、欺骗及策略制定等方面展现出超越人类的优秀表现。

这一切都表明，人工智能的竞争愈加激烈，各大模型在各自领域内不断创新、提升。未来，谁将最终赢得这场智能之战，值得我们持续关注。

如果觉得文章对你有用，请随意赞赏

快讯

GPT-4.5六小时神话破灭，xAI Grok-3强势登顶！

破晓

2025-03-04

2025-03-04

CC BY 4.0