Nvidia Blackwell GB200 迄今为止最快的 Blackwell GPU.
Blackwell GPU 的性能有望比 H100 GPU 提高 7 到 30 倍,B200 GPU将取代 H100 成为数据中心最先进的 AI 加速器。

Blackwell GPU芯片
图源:Nvidia
超级芯片GB200
将两个B200 GPU与一个基于Arm的Grace CPU进行配对,再通过900GB/s的超低功耗NVLink连接在一起,可以组成GB200超级芯片。Blackwell B200 GPU单颗芯片的功耗1000W,一颗Grace CPU和两颗Blackwell GPU组成的超级芯片GB200的功耗达到了2700W。

Blackwell GB200
图源:Nvidia
GB200使用了NVLink5.0,每颗B200 GPU有18个NVLink5.0端口可以和交换芯片NVlink Switch 进行互联,每个端口的速率是双向100GB/s,由4对差分信号线组成。
GB200 NVL4
英伟达GB200 NVL4是基于GB200扩展的一个全新模块,GB200 NVL4模块在更大的主板上配置两个Grace CPU和4个Blackwell B200 GPU。具有4-GPU NVLink域和1.3T相干内存的单服务器解决方案。

GB200 NVL4
图源:Nvidia
如何将GB200堆叠互联?
Blackwell Compute Node
将两个GB200超级芯片合并安装到一块主板上,可以组成一个Blackwell计算节点。Blackwell Compute Node 也叫Compute Tray。

Blackwell Compute Node
图源:Nvidia
GB200 NVL72
把18个Blackwell 计算节点(Compute Tray)组合在一起,可以形成新一代计算单元:GB200 NVL72(Blackwell Node × 18 + NVLink Switch = GB200 NVL72)。

GB200 NVL72 包含18个Blackwell Compute Node
图源:Nvidia
Blackwell NVLink Switch Tray
为了给18个Blackwell Compute Node提供数据交换能力,GB200 NVL72配备了9个NVLink交换节点(Switch Tray),每个交换节点中配置了2颗NVLink Switch芯片,向外提供14.4TB/s的聚合带宽。

Blackwell NVLink Switch Tray
图源:Nvidia
Quantum-X800
Quantum-X800可提供 144 个 800Gbps 端口和 ConnectX-8 SuperNIC 设备端智能网卡。利用英伟达 SHARPv4x 协议进行的网内算力也提升了 9 倍,达到 14.4 Tflops。

Blackwell Quantum-X800
图源:Nvidia
DGX GB200 SuperPod
把若干GB200 NVL72计算单元用Quantum InfiniBand交换机连接起来,再配合上散热系统,可以组成新一代DGX GB200 SuperPod集群。

DGX GB200 SuperPod
图源:Deltacomputer
DGX GB200 SuperPod 是一个包含32000块GPU的分布式超算集群,采用新型高效液冷机架,可在FP4精度下提供11.5 Exaflops算力和240TB高速内存。
您好,这是一条评论。若需要审核、编辑或删除评论,请访问仪表盘的评论界面。评论者头像来自 Gravatar。