在最近举行的 Re:Invent 大会上,亚马逊宣布与 AI 公司 Anthropic 合作,正在建设全球最大的人工智能超级计算机。

这台超级计算机的规模将是 Anthropic 目前最强大模型所使用集群的五倍,预计完成后将成为全球最大的人工智能训练机器。亚马逊表示,这一项目被称为 “Rainer”,将配备数十万颗最新的 AI 训练芯片 Trainium2。

image

图源备注:图片由AI生成,图片授权服务商Midjourney

亚马逊云服务(AWS)的首席执行官马特・加曼(Matt Garman)在会议上还透露,Trainium2将普遍可用,并将在 Trn2UltraServer 集群中专门用于训练前沿 AI。与使用 Nvidia 显卡的集群相比,新的 AWS 集群的成本将降低30% 至40%。虽然亚马逊是全球最大的云计算服务提供商,但在生成性 AI 领域,其竞争对手如微软和谷歌曾一度领先。不过,亚马逊今年已向 Anthropic 投资了80亿美元,并通过其 AWS 平台 Bedrock 推出了一系列帮助公司使用生成性 AI 的工具。

此外,亚马逊还展示了其下一代训练芯片 Trainium3,预计在2025年底向客户提供,性能将是当前芯片的四倍。业内专家指出,Trainium3在芯片间的数据传输方面进行了显著优化,这对大型 AI 模型的开发至关重要。尽管 Nvidia 在 AI 训练领域依然占据主导地位,但亚马逊的创新显示出市场正在出现竞争。

亚马逊还计划推出一系列工具,帮助客户处理生成性 AI 模型,这些模型往往成本高、可靠性差。新推出的 AWS 服务 Model Distillation 可以生成更小、更便宜的模型,而 Bedrock Agents 则可以创建和管理自动化任务的 AI 代理。加曼表示,企业对亚马逊新推出的工具将特别感兴趣,例如确保聊天机器人输出准确性的工具。

亚马逊的新验证工具名为 “自动推理”,与 OpenAI 此前推出的类似产品有所不同。它依赖于逻辑推理对模型的输出进行分析。

为了实现这一点,企业需要将数据和政策转换为逻辑分析格式。这种形式化推理方法在芯片设计和密码学等领域已有数十年的应用经验。通过组合多种具有自动推理功能的系统,企业可以构建更复杂的应用和服务。

划重点:

  • 💻 亚马逊与 Anthropic 合作,建设全球最大的 AI超级计算机,规模是目前最强大模型的五倍。

  • 🚀 新的训练芯片 Trainium3将于2025年底推出,性能是当前芯片的四倍,有望推动大型 AI 模型的发展。

  • 🛠️ 亚马逊推出多项工具帮助企业处理生成性 AI 模型,包括确保聊天机器人输出准确性的验证工具。