瑞技科技

重磅消息

高性能计算 (HPC) 网络

Cisco DNA / Arista CloudVision® 针对 H100 InfiniBand 的解决方案

概览

该解决方案基于 NVIDIA® H100 GPU,并与 Cisco DNAArista CloudVision® 管理平台集成,专为高性能计算(HPC)量身定制的InfiniBand 网络架构而设计。此配置涵盖 InfiniBand 网络、管理网络和存储网络,满足各种业务的需求。

Cisco DNA / Arista CloudVision® 针对 H100 InfiniBand 的解决方案架构图

InfiniBand

InfiniBand 是一种高性能网络技术,主要用于 HPC 环境、数据中心和企业网络。

目的:InfiniBand 旨在实现服务器与存储系统之间的高速数据传输、低延迟和高吞吐量。

带内管理

带内管理使用处理常规数据流量的同一网络来管理网络设备和系统。

目的:此方法允许管理员在同一用于正常数据通信的网络上执行配置、监控和故障排除等任务。

带外管理

带外管理使用与常规数据网络分开的专用管理网络来管理网络设备和系统。

目的:带外管理为管理任务提供了一条独立的路径,确保即使主数据网络出现故障,管理员也能访问网络设备。

InfiniBand 网络组件

由 NVIDIA® H100 GPU 和 InfiniBand 交换机提供动力,InfiniBand 网络提供超低延迟和高带宽。它通过先进的流量控制机制确保无损传输。

InfiniBand 网络组件​
编号 参考配置
1 Cisco: Nexus N9K-C9364C-GX, Nexus 92348GC-X
Arista: 7800 R3 Series
2 Cisco: QSFP-DD-800G-SR8
Arista: QSFP-DD-800G-SR8
NXTGEN: OSFP (800G) SR8 Transceiver
3 Cisco: QSFP-400G-SR4-S
Arista: OSFP-400G-SR4
NXTGEN: QSFP-DD (400G) FR4 Transceiver

管理网络

Cisco 和 Arista 交换机利用 Cisco DNA 或 Arista CloudVision 管理平台的先进功能。这些平台使客户能够高效地配置、监控、管理、主动故障排除和维护其 HPC 基础设施,从而提高利用率并降低总体运营成本。

管理网络架构图
编号 参考配置
1 Cisco Nexus 93240YC-FX2, Arista 7050SX3-48YC12
2 Cisco WS-C3850-48XS-F-S, Arista 7048T-A
3 Cisco Nexus 9364C, Arista 7060CX-64
4 Cisco Nexus 93180YC-EX, Arista 7280SR-48C6
5 NXTGEN: 10.3Gbps SFP+ Transceiver
NXTGEN: 25Gbps SFP28 Transceiver
6 NXTGEN: QSFP28 SR4 Transceiver

存储网络

Cisco/Arista 交换机支持 BGP 协议,具有强大的路由控制能力,同时确保存储网络的最优转发路径和低延迟转发状态。它们灵活且可扩展,以满足特定的容量和带宽需求。

存储网络架构
编号 参考配置
1 Cisco Nexus 9364C, Arista 7060CX-64
2 NXTGEN: QSFP28 SR4 Transceiver

RoCE 计算

通过 400G RoCE 无损解决方案增强 HPC 网络

此解决方案为 QSFP-DD 交换机和 OSFP 网卡提供了最佳的 400G 互连,解决了不同端口封装之间的兼容性问题。它专为 HPC 架构的网络拓扑设计,包括 RoC E计算网络、管理网络和存储网络,以满足多样化的业务需求。

RoCE 计算架构图
编号 参考配置
1 Cisco Nexus 9364C, Arista 7060CX-64
2 Cisco Nexus 93240YC-FX2, Arista 7050SX3-48YC12
3 Cisco Nexus 9332C, Arista 7060CX-32S
4 Cisco Nexus 9364D-GX2A, Arista 7060DX5-64S
5 NXTGEN QSFP28 SR4 transceiver 100G
6 NXTGEN 25Gbps SFP28 Transceiver