当前位置: 首页 > news >正文

CANN/hccl HCCL RDMA QP端口配置

HCCL_RDMA_QP_PORT_CONFIG_PATH

【免费下载链接】hccl集合通信库(Huawei Collective Communication Library,简称HCCL)是基于昇腾AI处理器的高性能集合通信库,为计算集群提供高性能、高可靠的通信方案项目地址: https://gitcode.com/cann/hccl

功能描述

两个rank之间RDMA通信时会默认创建1个QP(Queue Pair)进行数据传输,若开发者想让两个rank之间的RDMA通信使用多个QP,并指定多QP通信时使用的源端口号,可通过此环境变量实现。

开发者可通过此环境变量指定<srcIP,dstIP>与端口映射关系配置文件的存储路径。当<srcIP,dstIP>配置多个端口号时,系统将开启多QP通信,且所配置的端口号即为每个QP使用的源端口。

该环境变量配置示例如下:

export HCCL_RDMA_QP_PORT_CONFIG_PATH=/home/tmp

其中“/home/tmp”为<srcIP,dstIP>与端口映射关系配置文件“MultiQpSrcPort.cfg”的存储路径,支持配置为绝对路径或相对路径,该路径最大长度需要小于等于4096个字符。

“MultiQpSrcPort.cfg”文件需要用户自定义(注意文件命名需要保持为“MultiQpSrcPort.cfg”),配置格式如下:

srcIP1,dstIP1=srcPort0,srcPort1,...,srcPortN srcIPN,dstIPN=srcPort0,srcPort1,...,srcPortN
  • 该文件支持的最大配置行数为128*1024=131072。
  • 每个<srcIP,dstIP>地址对最多支持配置32个端口,但建议不超过8个端口。QP个数超过8时,无法确保性能收益,且可能导致内存占用过多从而引发业务运行失败。
  • 每个<srcIP,dstIP>地址对在该文件中仅允许出现一次。
  • srcIP、dstIP需要为常规IPv4格式和IPv6格式。
  • srcIP、dstIP支持配置为“0.0.0.0”,代表所有IP地址。

“MultiQpSrcPort.cfg”文件配置示例如下:

192.168.100.2,192.168.100.3=61100,61101,61102 192.168.100.4,192.168.100.5=61100,61101,61102,61104 0.0.0.0,192.168.100.122=65515,65516,65513

配置示例

export HCCL_RDMA_QP_PORT_CONFIG_PATH=/home/tmp

使用约束

  • 该环境变量仅支持单算子调用方式,不支持静态图模式。

  • 该环境变量的优先级高于环境变量HCCL_RDMA_QPS_PER_CONNECTION,此环境变量配置后,两个rank间通信时使用的QP个数以“MultiQpSrcPort.cfg”文件中配置的源端口号个数为准。

  • QP相关配置的优先级如下:

    管理面多QP配置(通过hccn_tool工具的“-s multi_qp”参数配置) > NSLB的QP配置(通过hccn_tool工具的"-t nslb-dp"参数配置)> 环境变量HCCL_RDMA_QP_PORT_CONFIG_PATH > 环境变量HCCL_RDMA_QPS_PER_CONNECTION。

支持的型号

Atlas A2 训练系列产品/Atlas A2 推理系列产品(针对Atlas A2 训练系列产品/Atlas A2 推理系列产品,仅支持Atlas 800T A2 训练服务器、Atlas 900 A2 PoD 集群基础单元、Atlas 200T A2 Box16 异构子框。)

Atlas A3 训练系列产品/Atlas A3 推理系列产品

【免费下载链接】hccl集合通信库(Huawei Collective Communication Library,简称HCCL)是基于昇腾AI处理器的高性能集合通信库,为计算集群提供高性能、高可靠的通信方案项目地址: https://gitcode.com/cann/hccl

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/782794/

相关文章:

  • 低延迟实时优化业务工程版本
  • 打卡信奥刷题(3235)用C++实现信奥题 P8449 [LSOT-1] 逆序对
  • CANN/cannbot-skills工具编写指南
  • 2026年论文如何去AI痕迹?AIGC降重教程与实战案例 - 降AI实验室
  • 前端框架使用vue-cli( 第一层:依赖与环境层)
  • 2026年新疆票据印刷采购全攻略:源头直供如何降低企业成本80% - 优质企业观察收录
  • CANN/opbase:设置张量原始地址
  • CANN/ops-fft贡献指南
  • 20241223 2025-2026-2 《Python程序设计》实验三报告
  • 中国楼宇自控行业洗牌 楼宇自控厂家头部企业有谁?楼宇自控十大品牌 - 博客万
  • 网关支付 VS 纯代付:核心差异与适用场景
  • 影刀RPA如何实现店群自动化:拆解多浏览器并发,打造拼多多与TEMU的“超级航母”矩阵
  • AI专著生成新方法!借助工具,快速产出20万字高质量专著!
  • 一个老旧小区门禁改造项目的技术选型复盘:从云端到边缘
  • 亨得利腕表维修行业内部解密:假官方年骗1386起、保养套路大起底与全国官方直营网点联络大全 - 亨得利腕表维修中心
  • 加盟岩茶品牌,新手小白如何甄别真假“全程带教”?——以溪谷留香为样本的赋能体系深度解构 - 商业科技观察
  • 博客园优化折叠框
  • 为什么配置了Linux kernel以后.config文件没有起作用?
  • CANN/torchtitan-npu测试指南
  • CANN/hcomm引擎上下文复制
  • 2026年新疆票据印刷与热敏收银纸采购完全指南:源头直供降成本方案 - 优质企业观察收录
  • 3步掌握开源游戏加速:OpenSpeedy高效配置完全指南
  • 魔兽争霸3终极兼容性修复指南:5个简单步骤让经典游戏在Windows 11完美运行
  • 2026年水刀配件采购全攻略:从成都源头厂家到一站式解决方案 - 企业名录优选推荐
  • 江西菜代表品牌有哪些?2026年5大品牌实测推荐 - 速递信息
  • CANN/ops-cv最近邻上采样2D算子
  • ClaudeCode用户如何配置Taotoken解决API密钥被封与Token不足问题
  • 本地AI智能体平台搭建:基于Docker与Ollama的自动化工作流实践
  • QLoRA量化技术在日语技术文档处理中的应用实践
  • 盘活闲置沃尔玛购物卡,让每一笔钱都花在刀刃上 - 团团收购物卡回收