OpenAI 的 GPT-4.5模型在刚刚发布后的六小时内,成功登顶人工智能竞技场,并成为全任务分类的第一名。然而,这一荣耀并未持续太久,马斯克的 xAI Grok-3模型迅速逆袭,反超成为总榜第一名。
根据投票数据显示,GPT-4.5与 Grok-3各自获得超过3000票,最终总分为1412对1411,仅差一分。尽管 GPT-4.5在大多数项目上表现优秀,但 Grok-3在特定的 “带风格控制” 和 “困难提示词” 任务上略有优势,这使得它在总分上实现了反超。
对于这场 “六小时逆转”,不少用户表示怀疑,认为如此迅速的变化是否合理。对此,有业内人士解释称,竞争榜单设有投票门槛,只有在同一时间内达到3000票的模型才能登上榜单。因此,刚刚发布不久的这两款模型能够同步达到该标准,是一场巧合的结果。
值得一提的是,尽管 GPT-4.5刚发布时面临着一些负面评价,用户对于其高情商的认可度却在日后显著上升。OpenAI 的首席执行官萨姆・奥尔特曼甚至分享了与 GPT-4.5的对话,表示这是他首次收到用户请求其承诺不再下架该模型。
与此同时,GPT-4.5还在一项另类竞赛中取得了优异表现,参与了一场类似于 “大模型狼人杀” 的游戏。在这场比赛中,各大 AI 模型需进行辩论、策略制定与投票,最终的胜者由被淘汰的成员组成的陪审团决定。GPT-4.5在合作、欺骗及策略制定等方面展现出超越人类的优秀表现。
这一切都表明,人工智能的竞争愈加激烈,各大模型在各自领域内不断创新、提升。未来,谁将最终赢得这场智能之战,值得我们持续关注。