日前,马斯克及其团队在直播中正式推出了 Grok3,宣称其为 “地球上最聪明的人工智能”。马斯克还表示,Grok3在数学、科学和编程的基准测试中超越了所有主流 AI 模型,并且计划将其应用于 SpaceX 的火星任务计算中,甚至预计在未来三年内将实现诺贝尔奖级别的突破。
然而,Grok3在实际测试中的表现却让人失望。在发布会之后,一些媒体针对 Grok3进行了测试,提出了一个经典问题:“9.11与9.9哪个大?” 意外的是,这款号称最聪明的 AI 未能给出正确答案,令网友们纷纷调侃其为 “天才不愿意回答简单问题”。
尽管官方资料显示,Grok3在大模型竞技场 Chatbot Arena 中表现良好,但与竞争对手 DeepSeek R1和 GPT-4.0的差距仅为1% 到2%。马斯克在发布会上透露,Grok3使用了超过20万张 H100芯片,总训练时间达到了两亿小时。