Nvidia Blackwell GB200 计算平台拆解

Nvidia Blackwell GB200 计算平台拆解

Nvidia Blackwell GB200 迄今为止最快的 Blackwell GPU.

Blackwell GPU 的性能有望比 H100 GPU 提高 7 到 30 倍,B200 GPU将取代 H100 成为数据中心最先进的 AI 加速器。

05sVvCWIsXR56ECNZzbfwDT-3.png

Blackwell GPU芯片

图源:Nvidia

 

超级芯片GB200

将两个B200 GPU与一个基于Arm的Grace CPU进行配对,再通过900GB/s的超低功耗NVLink连接在一起,可以组成GB200超级芯片。Blackwell B200 GPU单颗芯片的功耗1000W,一颗Grace CPU和两颗Blackwell GPU组成的超级芯片GB200的功耗达到了2700W。

企业微信截图_17349441722248.png

Blackwell GB200

图源:Nvidia

GB200使用了NVLink5.0,每颗B200 GPU有18个NVLink5.0端口可以和交换芯片NVlink Switch 进行互联,每个端口的速率是双向100GB/s,由4对差分信号线组成。

 

GB200 NVL4

英伟达GB200 NVL4是基于GB200扩展的一个全新模块,GB200 NVL4模块在更大的主板上配置两个Grace CPU和4个Blackwell B200 GPU。具有4-GPU NVLink域和1.3T相干内存的单服务器解决方案。

GB200-NVL4.jpg

GB200 NVL4

图源:Nvidia

如何将GB200堆叠互联?

Blackwell Compute Node

将两个GB200超级芯片合并安装到一块主板上,可以组成一个Blackwell计算节点。Blackwell Compute Node 也叫Compute Tray。 

NVIDIA-Blackwell-Compute-Node-800x380.jpg

Blackwell Compute Node

图源:Nvidia

GB200 NVL72

把18个Blackwell 计算节点(Compute Tray)组合在一起,可以形成新一代计算单元:GB200 NVL72(Blackwell Node × 18 + NVLink Switch = GB200 NVL72)。 

04a7007e-801f-4f8e-8210-e49d49188190_2042x1438.jpg

GB200 NVL72 包含18个Blackwell Compute Node

图源:Nvidia

Blackwell NVLink Switch Tray

为了给18个Blackwell Compute Node提供数据交换能力,GB200 NVL72配备了9个NVLink交换节点(Switch Tray),每个交换节点中配置了2颗NVLink Switch芯片,向外提供14.4TB/s的聚合带宽。 

NVIDIA-Blackwell-NVLINK-Switch-Pre-Hot-Chips-AI_5.png

Blackwell NVLink Switch Tray

图源:Nvidia

Quantum-X800

Quantum-X800可提供 144 个 800Gbps 端口和 ConnectX-8 SuperNIC 设备端智能网卡。利用英伟达 SHARPv4x 协议进行的网内算力也提升了 9 倍,达到 14.4 Tflops。

s-1055x595_v-fs_webp_94e609ac-8df7-45f0-90d5-97b3626c6d4b.png

Blackwell Quantum-X800

图源:Nvidia

DGX GB200 SuperPod

把若干GB200 NVL72计算单元用Quantum InfiniBand交换机连接起来,再配合上散热系统,可以组成新一代DGX GB200 SuperPod集群。

grow_all_big_v2.png

DGX GB200 SuperPod

图源:Deltacomputer

DGX GB200 SuperPod 是一个包含32000块GPU的分布式超算集群,采用新型高效液冷机架,可在FP4精度下提供11.5 Exaflops算力和240TB高速内存。

 

1 Comment

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注