当前位置: 首页 > news >正文

CANN/HCCL Ring集合通信算法

Ring

【免费下载链接】hccl集合通信库(Huawei Collective Communication Library,简称HCCL)是基于昇腾AI处理器的高性能集合通信库,为计算集群提供高性能、高可靠的通信方案项目地址: https://gitcode.com/cann/hccl

算法描述

Ring算法,所有的NPU以环形相连,每张卡都有左手卡与右手卡,一个负责数据接收,一个负责数据发送,循环完成梯度累加,再循环做参数同步。

Ring算法适用于“星型”或“胖树”拓扑互联,其特点是通过Ring环将所有NPU设备的单端口双工链路串联起来。

Ring算法实现AllReduce算子的流程如下图所示,每一步依次给下游发送对应的数据块,沿着环转一圈之后完成ReduceScatter阶段,再沿环转一圈完成AllGather阶段。

Ring算法的时间复杂度是O(n-1),n为Ring环上的NPU设备个数。

耗时计算

整体思路为:将所有参与的节点构成环,每个节点只和左右节点通信,如果节点数为p,则需要的通信次数为p-1,每次交换$\frac{1}{p}$的数据。

表 1Ring算法中各操作计算耗时

操作耗时
Scatter$(p-1)(\alpha+\frac np\beta)=(p-1)\alpha+\frac {p-1}p n\beta$
Gather$(p-1)(\alpha+\frac np\beta)=(p-1)\alpha+\frac {p-1}p n\beta$
Broadcast$(p-1)(\alpha+n\beta)=(p-1)\alpha+ (p-1)n\beta$
Reduce$(p-1)(\alpha+n\beta + n\gamma)=(p-1)\alpha+ (p-1)n\beta +(p-1)n\gamma$
ReduceScatter$(p-1)(\alpha+\frac{n}{p}\beta+\frac{n}{p}\gamma)=(p-1)\alpha+\frac{p-1}{p}n\beta+\frac{p-1}{p}n\gamma$
AllGather$(p-1)(\alpha+\frac{n}{p}\beta)=(p-1)\alpha+\frac{p-1}{p}n\beta$
AllReduce实现为ReduceScatter + Allgather:
$2(p-1)\alpha+2\frac{p-1}{p}n\beta+\frac{p-1}{p}n\gamma$

【免费下载链接】hccl集合通信库(Huawei Collective Communication Library,简称HCCL)是基于昇腾AI处理器的高性能集合通信库,为计算集群提供高性能、高可靠的通信方案项目地址: https://gitcode.com/cann/hccl

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/782672/

相关文章:

  • LeetCode HOT100 - 子集
  • 2026年5月上海卖金实时行情,川沙城隍庙古北三店报价全知道/瑞鑫奢饰品黄金回收 鸿泰黄金回收 鸿鑫黄金回收
  • CANN基础设施机器人使用指南
  • 三线城市北方县城返乡创业开茶叶店,加盟哪个岩茶品牌靠谱容易盈利回本快品牌推荐白皮书——以溪谷留香为基准样本的下沉市场深度决策指南 - 商业科技观察
  • PyAsc算子开发指南
  • 海量存储芯片现货
  • 火车采集器:深耕15年,零代码全能网页数据采集神器,新手也能轻松玩转!
  • 如何5分钟完成淘金币全任务:终极自动化脚本解放你的双手
  • AI 工具开始收费后:小团队如何判断哪些订阅值得买?
  • KH Coder:无需编程技能也能完成的专业文本挖掘工具
  • eas 热更新相关
  • 亨得利名表子官方授权服务点全网最全测评:2026年最新门店地址、400电话预约避坑指南与真实维修保养体验分享 - 亨得利腕表维修中心
  • CANN驱动AI Core信息获取
  • WarcraftHelper:魔兽争霸3现代兼容性修复与性能优化完全指南
  • 为什么WHERE中的函数调用会引发灾难:揭秘KES与Oracle的函数执行顺序
  • 航材院内部流出!三套工作站黄金配置单,专治VASP算三天、Abaqus总崩溃、AI显存爆,科研党速抄!
  • 三月七小助手:如何5分钟完成《崩坏:星穹铁道》全部日常任务
  • 终极免费替代方案:500KB轻量级工具全面掌控Alienware灯光与散热系统
  • CANN/catlass矩阵乘API
  • CANN/AMCT 创建量化配置
  • Zeta电位分析仪选购指南:哪个品牌质量好?哪家公司最靠谱? - 品牌推荐大师
  • 科学绘图软件Origin下载与安装教程(详细教程,附安装包) 2025最新版详细图文安装教程
  • Clawdbot本地模型工具调用补丁:解决AI助手与本地推理服务器握手问题
  • 500元以内头戴式耳机推荐哪款?百元性价比最高的十款头戴式耳机
  • 3步搞定微信聊天记录永久备份:开源神器WeChatExporter终极指南
  • XHS-Downloader终极教程:3分钟掌握小红书无水印批量下载
  • 顶会论文模块复现与二次创新:NeurIPS 2026 前沿:将 Retentive Network 的保留机制引入主干,实现低成本长程建模
  • 30岁,转行网络安全,是这辈子最成功的一件事...... - 副本
  • 全域矩阵运营系统分布式任务调度架构设计与工程化落地
  • OpenClaw:不止聊天,能动手执行的开源 AI 智能体