最近,英伟达(NVIDIA)新推出的 Blackwell AI 芯片在服务器中出现了过热问题,引发了客户的担忧,担心他们无法及时启用新的数据中心。据The Information报道,Blackwell 图形处理单元(GPU)在与设计能够容纳72个芯片的服务器机架连接时,出现了过热现象。

image

据知情人士透露,英伟达的工程团队正在积极应对这一问题,公司的工作人员已经多次要求供应商调整机架设计,以避免进一步的过热问题。同时,英伟达的发言人在接受《Seeking Alpha》采访时表示:“英伟达正在与领先的云服务提供商紧密合作,这是我们工程团队和流程中的重要组成部分。工程迭代是正常且可预期的过程。”

Blackwell 芯片于今年3月首次亮相,英伟达曾表示这些芯片将在第二季度开始发货,但随后出现了延迟。这一问题使得公司面临着挑战,因为它不仅影响了新产品的上市时间,也可能影响到客户的业务计划。

随着 AI 技术的快速发展,对高性能计算的需求不断增加,英伟达作为行业的领导者,自然希望能够在这一波浪潮中占据一席之地。然而,过热问题如果得不到及时解决,可能会影响到公司的市场声誉和客户满意度。业内专家指出,解决这些技术问题至关重要,尤其是在大规模部署前,这将直接影响到数据中心的性能和可靠性。

在此背景下,英伟达的工程团队正在加班加点,努力修复这一缺陷,以确保 Blackwell 芯片能够顺利投入使用。客户们也在密切关注进展,希望能尽快看到有效的解决方案,以便于他们能够顺利开启新的数据中心,满足日益增长的计算需求。

划重点:

🌡️ Blackwell AI 芯片在服务器中出现过热问题,客户对此表示担忧。

🔧 英伟达正与云服务提供商合作,尝试调整机架设计以解决问题。

📅 Blackwell 芯片于3月发布,原计划在第二季度发货,但遭遇了延迟。