当前位置: 首页 > news >正文

【CUDA】MNNVL和NVLink SHARP的关系

一、概括

MNNVL = 多节点 NVLink(底层互联) 集群

NVLS = MNNVL 集群上的 SHARP 卸载(上层加速)

即:NVLS 是 MNNVL 场景下的一个高级特性 / 加速模式。

二、说明

  • MNNVL = Multi-Node NVLink:多节点 NVLink,指跨服务器 / 跨节点用 NVLink + NVSwitch 把 GPU 直接连起来,形成一个大的 “逻辑节点”,NCCL 可以在上面做高速通信。
  • NVLS = NVLink SHARP:是第三代 NVSwitch(Hopper 架构,NVLink4)上的在网计算卸载,把 NCCL 的 AllReduce 等集体操作直接 offload 到 NVSwitch 硬件上执行,不占用 GPU 核和 CPU。

1、一句话关系

MNNVL 是 “通路 / 拓扑”,NVLS 是 “在这个通路上的硬件卸载能力”

  • MNNVL:解决 “多节点怎么用 NVLink 连起来” → 构建跨节点 NVLink 全连接 Fabric。
  • NVLS:解决 “在这个 NVLink Fabric 上,集体通信怎么加速” → 把 NCCL 运算卸载到 NVSwitch。

2、更细一点的对应

  1. 硬件前提
    1. 都需要:Hopper(H100)及以后 GPU + 第三代 NVSwitch + NVLink4
    2. MNNVL:节点间通过 NVSwitch 组网。
    3. NVLS:在同一个 NVSwitch 域(clique)内启用 SHARP 卸载。
  1. 层级关系
    • MNNVL = 多节点 NVLink 集群(底层互联)
    • NVLS = MNNVL 集群上的 SHARP 卸载(上层加速)
    • 即:NVLS 是 MNNVL 场景下的一个高级特性 / 加速模式
  1. NCCL 视角
    • 没 MNNVL:跨节点走 InfiniBand / Ethernet。
    • 有 MNNVL:跨节点走 NVLink,但 AllReduce 仍在 GPU 上算。
    • 有 MNNVL + NVLS:跨节点走 NVLink,AllReduce 交给 NVSwitch 算,延迟更低、GPU 占用更少。

3、极简总结

  • MNNVL = 多节点 NVLink 组网(路)
  • NVLS = NVLink 网络上的硬件卸载(加速器)
  • 关系:NVLS 运行在 MNNVL 构建的 NVLink Fabric 之上,是 MNNVL 的增强特性

flowchart TD subgraph A [多节点NVLink集群] direction LR Node1[GPU节点1] --- NVSwitch_Fabric[NVSwitch Fabric<br>跨节点NVLink全连接] --- Node2[GPU节点2] end subgraph B [NVLS加速层] SHARP[SHARP引擎<br>AllReduce卸载] end A -- 提供底层 NVLink 通路 --> B B -- 运行于 MNNVL 之上 --> C[集体通信加速<br>低延迟 / 少GPU占用] MNNVL[多节点NVLink组网(路)] -.-> A NVLS[NVLink SHARP(加速器)] -.-> B

更简洁:

http://www.jsqmd.com/news/978095/

相关文章:

  • 2026年成都名酒回收商家:核心技术维度深度解析 - 优质品牌商家
  • 过期食品被晒图投诉,舆情处置时发声明为什么被骂更惨
  • 别再傻傻用pip list了!Python包版本查询的5种高效姿势(含Pycharm/VSCode环境)
  • 安卓必备神器,收藏到吃灰都要下!
  • 2.4万Star的Cookiecutter,用模板一键生成项目骨架
  • 原神FPS解锁器终极指南:从内存操作到.NET 8架构的完整解析
  • 别再只做本地开发了!手把手教你用IIS和花生壳内网版,把本地项目变成临时演示环境
  • Miniconda
  • 7不同岗位如何挑选 AI 证书?运营、产品、设计、市场选型全指南
  • SONIC: Supersizing Motion Tracking for Natural Humanoid Whole-Body Control
  • Windows右键菜单终极管理指南:使用ContextMenuManager打造高效桌面环境
  • C语言进化与关键字扩展全梳理
  • 描述性统计:数据世界里被低估的“快枪手”
  • 告别盲目调用:手把手教你用Python CLR分析并安全调用未知C# DLL
  • Flink入门避坑指南:从Checkpoint配置到State管理,新手最容易踩的5个坑
  • 5分钟掌握九大网盘直链下载终极方案:告别客户端束缚,一键获取真实下载链接
  • 2026年不锈钢法兰管件供应商排行及核心能力盘点 - 优质品牌商家
  • 【课程设计/毕业设计】基于springboot+微信小程序的旅游线路定制微信小程序【附源码、数据库、万字文档】
  • 基于深度学习YOLOv10的森林火灾烟雾识别检测系统(YOLOv10+YOLO数据集+UI界面+Python项目源码+模型)
  • Vue02
  • 探索Python在数据科学中的关键应用及未来趋势(07)
  • 数字示波器参数大全:从入门到精通(一)
  • 指令周期:一条指令是怎么被执行的?
  • 从Excel到‘一张图’办案:手把手教你用AbutionGraph为基层民警搭建智能案件线索分析平台
  • 石家庄空调移机怎么选?2026年5家公司全面对比 - 本地品牌推荐
  • 技术深度解析:Jasminum - Zotero中文文献管理的架构设计与实现
  • 使用JavaBean计算三角形面积和周长
  • 从近年外贸出海实操案例看海外云搭外贸独立站的落地细节
  • Python读取光谱仪数据的完整代码示例
  • 2026年q2达州门窗定制厂家实测评测:达州家装门窗设计/达州封窗/达州断桥铝门窗/谁更靠谱 - 优质品牌商家