GPU 多卡互联

多卡如何互联通信，以 NV / AMD 实现为例。

Nvidia NvLink

参考：

单卡

指一张 GPU 连接到 CPU 主板上：

1 Card C2C

C2C（Chip-to-Chip）通信是指同一块GPU芯片内的不同计算单元（如SM，Streaming Multiprocessor）之间的数据传输。这种通信通常在GPU内部的高速缓存或共享内存中进行。

单节点多卡

P2P（Peer-to-Peer）通信是指GPU之间进行数据传输。NVIDIA的P2P通信可以通过PCIe或NVLink实现。NVLink是NVIDIA开发的高带宽GPU互连接口，旨在解决PCIe带宽和延迟瓶颈。NVLink提供比PCIe更高的带宽和更低的延迟，使得GPU之间的数据传输更加高效。NVLink 2.0和3.0版本进一步提升了带宽和效率。NVSwitch是一种高性能互连交换机，允许多个GPU之间实现全互连（All-to-All）的高带宽通信。它类似于传统网络中的交换机，但专门设计用于GPU之间的数据传输。NVSwitch支持多达16个GPU之间的全带宽互连，非常适合大型深度学习和高性能计算集群。

通过 PCIe 实现互联：

P2P: PCIe