DeepSeekR1671b 已作为英伟达微服务在 build.nvidia.com 平台发布。

该微服务基于单一英伟达 HGX H200 系统,可每秒处理高达 3872 个令牌,提供卓越的性能。

目前,开发人员可对该 API 进行测试和实验。预计该 API 将很快作为可下载的英伟达微服务,成为英伟达AIEnterprise 软件平台的一部分。

英伟达微服务(NIM)是一种云原生微服务技术,用于简化生成式 AI 模型在云、数据中心和 GPU 加速工作站上的部署。

DeepSeek R1 是 DeepSeek(幻方量化旗下 AI 公司)发布的大型模型,其在数学、代码编写、自然语言推理等任务上的性能与 OpenAI 的 o1 模型相当。

image