当前位置: 首页 > news >正文

Nvidia HGX B200平台NVLink Switch变化

2dab0f0034c2807f6d94357bb66b03ee.jpeg

Nvidia HGX B200主板上的NVLink Switch变化

   

在2024年的Computex大展上,富士康子公司Ingrasys的展台上矗立了一块独特的Nvidia HGX B200主板。这块主板的亮点在于,它没有安装散热片。仔细观察,我们可以发现NVLink Switch Chip的数量从H100的4个减少到了2个,而且它们的位置也发生了变化。这一创新设计无疑为未来的硬件发展开辟了新的可能性。

ae457b6c6bf3da2087cb4f7af6f9cb8e.jpeg

第一代NVSwitch

第一代NVSwitch是随着Nvidia的DGX-2计算机的推出而引入的。第一代NVSwitch是一个拥有20亿晶体管、18个端口的NVLink switch。每个端口以50 GB/s的速度运行,Switch的总带宽为900 GB/s。该交换机允许最多九个设备中的任何一个被路由到其他九个设备中的任何一个。除了NVLink端口,交换机还有额外的控制和管理的I/O接口,包括x4 PCIe Gen 2管理端口、I2C和GPIO。

DGX-2使用每块基板6个NVLink来创建GPU的全连接网络。

c97a758ec370d6406cdee44a4f6e4e70.jpeg

DGX-2拥有两块基板,全面连接了所有16个V100 GPU。每个交换机有两个未启用的端口,这些端口可能会在配置中使用POWER9微处理器,因为它们原生支持NVLink 2.0。

051ea454b270c1247e1f7768463409a2.jpeg

下图展示Inspur NF5488M5 HGX2的NVSwitch散热片,共6个,清晰可见。

906bb2bf50e61394ed24ba0e857a3f92.jpeg

第二代NVSwitch

04657092d5f7dadb4fc706f35027594d.jpeg

在NVIDIA A100时代,NVSwitch散热器扩大,HGX A100平台由NVIDIA构建、预组装并发给供应商。

Inspur NF5488A5搭载NVIDIA HGX A100,6个NVSwitch散热片助力卓越性能。

a5c9d1d62a95696b9683c25b61d2f87a.jpeg

第三代NVSwitch

0ca91ef39c58b45453aa0544a6a7f297.jpeg

H100这一代,4个NVSwitch在基板的一侧。

这是ASUS ESC N8A E12 NVIDIA HGX H100 。

862e7bdf70ce9bfdfb710e414f38cb0f.jpeg

下面是Nvidia HGX H200,看上去与HGX H100的设计非常相似。

fa65f3c5871df0531865bee86cd595d9.jpeg

第四代NVLink Switch

带着散热片的HGX B100

07df8fe618d64e7fee443306090402ae.jpeg

发布会上的HGX B100图片

538f73b6bca51d4a9d485c3b51be9383.jpeg

27c31434044b2a5577acc8afcab614e8.jpeg

"通过一款无散热片设计的HGX B200主板,我们可以清楚地看到NVLink Switch芯片的安装位置。经NVIDIA官方确认,这款主板上的NVLink Switch芯片与B200版本保持一致。"

b258e54f8622c34b5f2729dfd434b708.jpeg

在这里,我们可以观察到PCIe Retimer露出散热器。这些Retimer通常搭载较小的散热器,因为它们的TDP大约在10-15W之间,具体取决于您所讨论的是Astera Labs、Broadcom还是Marvell的此尺寸版本。

078cef325f83449f9491a0f19bcedf5d.jpeg

af4bf793e73270a2da558986981c0b67.jpeg

结论

NVLink Switch芯片体积更大,将它们移动到主板中央可能有助于减少迹线长度。这对于进行高速信号传输是有益的。此外,NVIDIA B200 GPUs的四个GPU集合在两侧,这样做,进一步减少了GPU到NVLink Switches的迹线长度 。

0b45042ab94b496feb13cbdf9c2e5107.jpeg

参考资料:

请访问 servethehome.com,了解英伟达(NVIDIA)展示的大型 NVLink 交换芯片如何切换到 HTX B200 和 B100。


-对此,您有什么看法见解?-

-欢迎在评论区留言探讨和分享。-


http://www.mrgr.cn/news/50736.html

相关文章:

  • 实用建议!如何为企业选择合适的供应商
  • kubernets(二)
  • Arthas常用的命令(二)--trace
  • 遨游浏览器与谷歌浏览器云同步功能的对比分析
  • 2011年国赛高教杯数学建模D题天然肠衣搭配问题解题全过程文档及程序
  • 回头看以及向后看
  • 虚拟机Windows10系统如何联网
  • lua脚本使用cjson转换json时,空数组[]变成了空对象{}
  • 【DevOps工具篇】Docker的DNS原理
  • 使用TeamViewer远程局域网内的两台电脑
  • Cortex-A55国产处理器_教学实验箱_操作案例分享:5-21 手势识别实验
  • Transformer 的缩放因子为什么需要开平方根
  • 申请书阿拉伯语翻译的特点
  • 一键快捷回复软件助力客服高效沟通
  • AD9680(adc直采芯片)使用说明
  • 2024-10-15 Nuxt3打包部署到Nginx流程
  • 中科星图GVE(AI案例)——AI提取采样区域的水体区域
  • 【学术会议-5】跨越边界-计算机科学与技术领域会议,共同探讨创新与合作,推动科技发展!
  • 设计模式--单例模式
  • 【ROS2】订阅手柄数据,发布运动命令