当前位置: 首页 > news >正文

CANN/HCCL NPU通信端口配置

HCCL_NPU_SOCKET_PORT_RANGE

【免费下载链接】hccl集合通信库(Huawei Collective Communication Library,简称HCCL)是基于昇腾AI处理器的高性能集合通信库,为计算集群提供高性能、高可靠的通信方案项目地址: https://gitcode.com/cann/hccl

功能描述

当通信域的创建方式为“基于root节点信息创建”时,开发者可通过此环境变量配置HCCL在NPU侧使用的通信端口。

该环境变量支持配置为具体的端口、端口范围或者字符串“auto”。

  • 若指定具体的端口号或端口范围,规划的端口数量建议不小于单个NPU上的HCCL进程数,端口号取值范围为[1,65535],且需要确保指定的端口未被其他进程占用。需要注意,[1,1023]为系统保留端口,应避免使用这些端口。

    具体端口号与端口范围可以组合使用,中间使用英文“,”分隔,但逗号之间的端口号/端口范围不能存在范围交叉,配置方式可参见配置示例。

  • 若指定为字符串“auto”,代表HCCL使用的NPU端口号由操作系统动态分配。

  • 若不配置该环境变量,HCCL在NPU侧使用的通信端口默认为16666。

配置示例

//方式一:配置为端口范围。 export HCCL_NPU_SOCKET_PORT_RANGE="61000-61050" //方式二:具体的端口号与端口范围配合使用,使用英文“,”分隔。 export HCCL_NPU_SOCKET_PORT_RANGE="61000,61050-61100,61200-61210" //方式三:指定具体的端口号,使用英文“,”分隔。 export HCCL_NPU_SOCKET_PORT_RANGE="57000,57005,57007,58008,58100,58105,58107,58108" //方式四:操作系统动态分配端口号 export HCCL_NPU_SOCKET_PORT_RANGE="auto"

使用约束

  • 在多卡场景下,若需要配置该环境变量,则同一通信域内的所有卡都必须进行配置。
  • 若业务为单卡多进程场景(即多个业务进程同时共用一个NPU),建议配置此环境变量,否则业务可能会因为端口冲突运行失败。但需要注意,多进程会对资源开销、通信性能产生一定的影响。
  • 针对Atlas A2 训练系列产品/Atlas A2 推理系列产品,若网络中存在MC²通算融合算子(计算和通信融合的算子,例如AllGatherMatmul、MatmulReduceScatter、AlltoAllAllGatherBatchMatMul等),不支持配置此环境变量。

支持的型号

Ascend 950PR/Ascend 950DT

Atlas A3 训练系列产品/Atlas A3 推理系列产品

Atlas A2 训练系列产品/Atlas A2 推理系列产品(针对Atlas A2 训练系列产品/Atlas A2 推理系列产品,仅支持Atlas 800T A2 训练服务器、Atlas 900 A2 PoD 集群基础单元、Atlas 200T A2 Box16 异构子框。)

【免费下载链接】hccl集合通信库(Huawei Collective Communication Library,简称HCCL)是基于昇腾AI处理器的高性能集合通信库,为计算集群提供高性能、高可靠的通信方案项目地址: https://gitcode.com/cann/hccl

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/782751/

相关文章:

  • 别让分期乐购物额度,成为你账户里的闲置底气 - 团团收购物卡回收
  • 创业团队如何利用 Taotoken 统一管理多个 AI 模型的 API 调用
  • 025环形链表
  • 【Python专项】进阶语法-系统资源监控与数据采集(1)
  • 开发者专属:用coding-plan打造高效技术学习与自律管理系统
  • 纳米工艺IC测试挑战与BIST技术创新
  • 子弹型制冰机实力厂家揭秘:核心技术强、产能稳定的生产商推荐 - 品牌推荐大师
  • 如何用500KB开源工具彻底替代AWCC:AlienFX Tools终极控制指南
  • CANN驱动获取设备板ID
  • 2026年十大AI音乐软件推荐:国际标杆领衔,蘑兔AI紧随其后
  • CANN/pyasc按位或运算API
  • Kubernetes网络模型深度解析与实践
  • CANN/ge函数处理点API
  • 如何用纯C语言将网易云NCM加密音乐转换为通用MP3格式:完整技术解析与操作指南
  • 2026年一千京东卡回收多少钱,最新折扣率表 - 猎卡回收公众号
  • 【官方首发】亨得利高端腕表服务最新公告:2026年全国售后服务网络优化升级官方解读(附统一服务标准全国网点预约通道防伪指南) - 亨得利腕表维修中心
  • Gemma-4模型在NPU上推理
  • CANN/metadef算子平铺构建
  • 如何用Sunshine搭建个人游戏串流服务器:跨设备畅玩3A大作的完整指南
  • 浅谈GaussDB (DWS)技术【玩转PB级数仓GaussDB(DWS)】
  • 2026年不干胶标签与办公用纸一站式采购完全指南 - 优质企业观察收录
  • PotPlayer字幕翻译插件深度解析:打破语言壁垒的专业解决方案
  • 根脉——溯源
  • B站视频转文字终极指南:如何用AI技术快速提取视频内容并生成文字稿
  • PotPlayer字幕翻译插件架构解析:百度翻译API集成与性能优化指南
  • InsMatrixAutomation 日志系统设计深度解析:从 Loguru 到企业级日志实践
  • CANN Alpamayo-R1智驾优化
  • 2026法治教育展厅怎么做?未成年法治教育展厅展馆设计 - 新闻快传
  • 微信立减金闲置率近五成,教你合规盘活你的支付权益 - 团团收购物卡回收
  • CANN算子库GeGluV3算子