当前位置: 首页 > news >正文

CANN/hcomm HCCL通信管理器API

HcclGetRootInfo

【免费下载链接】hcommHCOMM(Huawei Communication)是HCCL的通信基础库,提供通信域以及通信资源的管理能力。项目地址: https://gitcode.com/cann/hcomm

产品支持情况

  • Ascend 950PR/Ascend 950DT:支持
  • Atlas A3 训练系列产品/Atlas A3 推理系列产品:支持
  • Atlas A2 训练系列产品/Atlas A2 推理系列产品:支持
  • Atlas 推理系列产品:支持
  • Atlas 训练系列产品:支持

[!NOTE]说明 针对Atlas A2 训练系列产品/Atlas A2 推理系列产品,仅支持Atlas 800T A2 训练服务器、Atlas 900 A2 PoD 集群基础单元、Atlas 200T A2 Box16 异构子框。 针对Atlas 推理系列产品,仅支持Atlas 300I Duo推理卡。

功能说明

此接口需要在HCCL初始化接口HcclCommInitRootInfo或HcclCommInitRootInfoConfig前调用,仅需在root节点调用,用于生成root节点的rank标识信息(HcclRootInfo)。

  • 该接口需要和初始化接口HcclCommInitRootInfo或HcclCommInitRootInfoConfig接口配对使用,不能单独使用。

  • 该接口支持单线程循环调用,即开发者可在一个for循环中通过“指定不同的Device + 调用此接口”,从而实现在一个线程中获取不同设备的rootInfo信息。

    假设一个AI Server中有8张卡,8张卡分成4个通信域,每个通信域中的两张卡之间通信,如下图所示。

    获取rootInfo信息并进行集合通信初始化的流程如下图所示。

    首先在一个线程中通过切换Device创建4个rootInfo信息,并存入一个长度为4的数组中。rootInfo信息获取完成后,起4个线程,分别调用HcclCommInitRootInfo或者HcclCommInitRootInfoConfig接口(上图中以HcclCommInitRootInfo接口示意)根据不同的rootInfo信息进行通信域初始化。

  • 多机集合通信场景,调用HcclGetRootInfo前,可以进行如下操作(非必选):

    • 配置环境变量HCCL_IF_IP或HCCL_SOCKET_IFNAME,指定HCCL的初始化root网卡IP(环境变量HCCL_IF_IP的优先级高于HCCL_SOCKET_IFNAME,若二者都不配置,默认使用网卡名称的字典序升序选择root网卡)。
    • 配置环境变量HCCL_WHITELIST_DISABLE开启白名单校验,并通过HCCL_WHITELIST_FILE指定通信白名单配置文件(若不配置,默认关闭通信白名单校验)。

函数原型

HcclResult HcclGetRootInfo(HcclRootInfo *rootInfo)

参数说明

参数名输入/输出描述
rootInfo输出本rank的标识信息,主要包含device ip、device id等信息。此信息需广播至集群内所有rank用来进行HCCL初始化。
HcclRootInfo类型的定义可参见HcclRootInfo。

返回值

HcclResult:接口成功返回HCCL_SUCCESS,其他失败。

约束说明

调用示例

uint32_t rankSize = 8; uint32_t deviceId = 0; // 生成 root 节点的 rank 标识信息 HcclRootInfo rootInfo; HcclGetRootInfo(&rootInfo); // 初始化通信域 HcclComm hcclComm; HcclCommInitRootInfo(rankSize, &rootInfo, deviceId, &hcclComm); // 销毁通信域 HcclCommDestroy(hcclComm);

【免费下载链接】hcommHCOMM(Huawei Communication)是HCCL的通信基础库,提供通信域以及通信资源的管理能力。项目地址: https://gitcode.com/cann/hcomm

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/783610/

相关文章:

  • 【山东大学主办、EI稳定检索】第六届精密仪器与光学工程国际学术会议(PIOE 2026)
  • 湖北肖氏景观工程:阳新水泥制品加工怎么联系 - LYL仔仔
  • CANN/pypto双曲余弦函数
  • 代码 + Markdown知识库
  • CCAA审核员可以挂靠吗? - 众智商学院官方
  • 温岭市大溪致翔机械设备租赁:浙江吊车租赁推荐几家 - LYL仔仔
  • CANN/shmem Root Info工具指南
  • AGI赋能物联网:从数据管道到智能体网络的范式革命
  • 虚拟机创建及 Linux 系统安装
  • 2026年5月成都GEO优化服务商盘点:8家机构参考测评与选型分析 - 速递信息
  • WebSocket URL 配置记录
  • CANN/ops-nn LeakyReLU激活函数
  • CANN/hccl框架集成指南
  • 支付宝立减金套装是什么?可以回收吗? - 圆圆收
  • CANN/HCOMM拓扑层级类型查询
  • CANN/torchtitan-npu指标与调试指南
  • HarmonyOS 6 ArkUI 运动路径动画(motionPath)使用文档
  • 长期项目使用Taotoken按Token计费带来的成本可控性体验
  • JVM 深度调优实战:从 JDK 8 到 JDK 21 的演进与中间件落地
  • cpu 系统调用热点 中断 调度队列 - 小镇
  • 菏泽牡丹区4个校区全科语文英语数学一对一单词速记快速提分 - 众智商学院课程中心
  • 2026最权威的六大降AI率方案推荐榜单
  • 基于openeuler2403sp3的容器,打包django运行环境镜像
  • 【通讯协议】232通讯:参数、外围电路组成及实战接线
  • 别再手动点地图了!用C++代码一键搞定ROS机器人(RVIZ)初始位姿设置
  • 空椅子上的辩证:AI元人文与中国实践哲学的八个张力统一
  • 基于LangChain.js与Azure构建企业级RAG聊天应用实战指南
  • CANN/opbase文档贡献指南
  • 视频理解中的稀疏注意力机制优化实践
  • Claude Code 软考辅导实战:高效备考与解题技巧