信息差

xAI Grok-3 强势登顶：从编码到创意写作，全面超越 GPT-4.5 的大模型新王

xAI 最近发布了一则激动人心的消息，其最新AI 模型 Grok-3在 Chatbot Arena 排行榜上表现突出。这款模型被命名为“grok-3preview-02-24”，在多个关键领域展现了卓越性能。

xAI 的 Grok-3-Preview-02-24就以1分的微弱优势超越 GPT4.5-Preview。Grok-3获得了超过3，000票，并总体上与第一名并列。它在困难提示、编码任务、数学问题、创意写作、指令遵循以及处理较长查询方面表现尤为出色。Chatbot Arena 是一个通过人类偏好进行大规模语言模型（LLM）评估的众包平台，使用 Elo 评级系统为模型排名，提供全面的性能衡量。

这一成就标志着 xAI 和其创始人埃隆·马斯克在 AI 发展领域的显著进展。马斯克一直倡导开发强大且与人类价值观相符的 AI。Grok-3在这一基准测试中的成功凸显了模型的能力，以及 xAI 在竞争激烈的 AI 领域的进步。

值得注意的是，“grok-3preview-02-24”被描述为最新生产模型，但名称中包含“preview”，这可能表明它仍处于测试阶段，这一细节可能引发对其完全生产就绪性的讨论。

如果觉得文章对你有用，请随意赞赏

快讯

xAI Grok-3 强势登顶：从编码到创意写作，全面超越 GPT-4.5 的大模型新王

https://soraor.com/archives/ai-today_20250304101716

作者

破晓

发布于

2025-03-04

更新于

2025-03-04

许可协议

CC BY 4.0