NVIDIA 发布 Rubin:六款新芯片驱动下一代AI超级计算机

简要介绍

英伟达在2026年CES上推出了Rubin平台,将六款新芯片整合为一体的AI超级计算机,提供比Blackwell系列高出5倍的训练计算能力。

NVIDIA Unveils Rubin: Six New Chips Power Next-Gen AI Supercomputer

科技公司英伟达在CES 2026上推出了Rubin平台,打造了一款由六款新芯片组成的统一AI超级计算机,整体提供比Blackwell系列高出五倍的训练计算能力。该平台旨在为构建、部署和安全大型AI系统设定新标杆,同时降低成本,推动AI技术的更广泛应用。

Rubin平台通过其六个组件的紧密协同设计实现高性能:英伟达Vera CPU、英伟达Rubin GPU、英伟达NVLink 6交换机、英伟达ConnectX-9 SuperNIC、英伟达BlueField-4 DPU以及英伟达Spectrum-6以太网交换机。这种集成方式缩短了训练时间,降低了推理令牌的成本。

Rubin引入了五项关键创新,包括下一代NVLink互连、Transformer引擎、机密计算、RAS引擎以及英伟达Vera CPU。这些技术进步实现了智能代理AI、先进推理和大规模混合专家模型(MoE(MoE))的推理,成本比Blackwell平台低十倍。系统还能用四分之一的GPU训练MoE模型,进一步加快AI的普及。

该平台预计将由领先的AI实验室、云服务提供商、硬件制造商和创业公司部署,包括亚马逊Web服务((AWS))、Anthropic、Black Forest Labs、思科、Cohere、CoreWeave、Cursor、戴尔科技、谷歌、Harvey、HPE、Lambda、联想、Meta、微软、Mistral AI、Nebius、Nscale、OpenAI、OpenEvidence、甲骨文云基础设施((OCI))、Perplexity、Runway、Supermicro、Thinking Machines Lab和xAI。

揭示面向AI工厂的原生存储与软件定义基础设施

英伟达Rubin引入了面向AI的原生存储和安全、软件定义的基础设施,旨在高效支持大规模AI工作负载。由BlueField-4驱动的英伟达推理上下文内存存储平台,支持快速共享和重用关键值缓存数据,提升多轮智能代理AI应用的吞吐量和能效。BlueField-4还包括先进的安全可信资源架构((ASTRA)),提供单一可信控制点,用于裸金属和多租户AI环境中的安全配置和隔离。

该平台提供多种配置,包括Vera Rubin NVL72,集成72个Rubin GPU、36个Vera CPU、NVLink 6、ConnectX-9 SuperNICs和BlueField-4 DPU,以及支持x86的生成式AI平台的HGX Rubin NVL8。英伟达DGX SuperPOD作为部署Rubin系统的参考架构,结合了计算、网络和管理软件。

下一代网络和存储由Spectrum-6和Spectrum-X以太网平台提供,配备集成光学器件、AI优化的网络结构和高速200G SerDes通信。这些创新提升了可靠性、能效和扩展性,使Rubin基础的AI工厂能够跨多个站点作为统一环境运行,并支持未来百万GPU基础设施。

英伟达Rubin全面投产,准备在云端和AI实验室部署

新平台已全面投产,预计在2026年下半年通过合作伙伴提供Rubin系统。主要云服务商,包括AWS、谷歌云、微软和OCI,以及英伟达云合作伙伴如CoreWeave、Lambda、Nebius和Nscale,率先部署了Rubin驱动的实例。微软计划将英伟达Vera Rubin NVL72机架级系统集成到下一代AI数据中心,包括未来的Fairwater AI超级工厂,作为企业、研究和消费应用中先进训练和推理工作的基础。

CoreWeave将把Rubin系统纳入其AI云平台,支持多种架构,优化训练、推理和智能代理AI工作负载的性能。思科、戴尔、HPE、联想和Supermicro也预计将提供基于Rubin产品的服务器。包括Anthropic、Cohere、OpenAI、Meta在内的领先AI实验室,正采用Rubin训练更大、更强的模型,并支持长上下文、多模态系统,延迟和成本均优于之前的GPU代。

基础设施和存储合作伙伴,如IBM、NetApp、Nutanix、Pure Storage、SUSE和VAST Data,正与英伟达合作设计下一代Rubin平台。Rubin代表英伟达第三代机架级架构,拥有80多家MGX生态合作伙伴支持。红帽宣布扩大合作,提供针对Rubin优化的完整AI堆栈,利用其混合云产品组合,包括Red Hat Enterprise Linux、OpenShift和Red Hat AI,广泛应用于《财富》全球500强企业。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)