当前位置: 首页 > news >正文

华为/HCCL多QP通信阈值配置

HCCL_MULTI_QP_THRESHOLD

【免费下载链接】hccl集合通信库(Huawei Collective Communication Library,简称HCCL)是基于昇腾AI处理器的高性能集合通信库,为计算集群提供高性能、高可靠的通信方案项目地址: https://gitcode.com/cann/hccl

功能描述

rank间RDMA通信使用多QP通信的场景下,开发者可通过本环境变量设置每个QP分担数据量的最小阈值。

该环境变量需要配置为整数,取值范围:[1,8192],默认值:512,单位:KB。

  • 如果“(rank间单次通信数据量 / HCCL_RDMA_QPS_PER_CONNECTION的值) < HCCL_MULTI_QP_THRESHOLD的值”,则HCCL执行时会自动减少QP个数,使得每个QP上分担的数据量大于等于HCCL_MULTI_QP_THRESHOLD的值,例如:

    rank间单次通信数据量为1MB,HCCL_RDMA_QPS_PER_CONNECTION配置为4,HCCL_MULTI_QP_THRESHOLD配置为512,此时每个QP最少要求分担512KB的数据量,则HCCL执行时,会减少QP个数为2,仅使用2个QP进行rank间的数据传输。

  • 当rank间数据量小于HCCL_MULTI_QP_THRESHOLD时使用单QP传输。

  • 当每个QP分担的数据量大于512KB时,使用HCCL Test工具进行RDMA流量测试时(仅测试跨机流量,不使用HCCS链路),多QP场景的下发调度开销相对于单QP场景性能劣化小于3%。

[!NOTE]说明 可通过环境变量HCCL_RDMA_QPS_PER_CONNECTION或HCCL_RDMA_QP_PORT_CONFIG_PATH开启多QP通信。

配置示例

export HCCL_MULTI_QP_THRESHOLD=512

使用约束

该环境变量仅支持单算子调用方式,不支持静态图模式。

支持的型号

Atlas A2 训练系列产品/Atlas A2 推理系列产品(针对Atlas A2 训练系列产品/Atlas A2 推理系列产品,仅支持Atlas 800T A2 训练服务器、Atlas 900 A2 PoD 集群基础单元、Atlas 200T A2 Box16 异构子框。)

Atlas A3 训练系列产品/Atlas A3 推理系列产品

【免费下载链接】hccl集合通信库(Huawei Collective Communication Library,简称HCCL)是基于昇腾AI处理器的高性能集合通信库,为计算集群提供高性能、高可靠的通信方案项目地址: https://gitcode.com/cann/hccl

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/786667/

相关文章:

  • LeetCode 155. 最小栈
  • 创业公司如何利用Taotoken聚合API低成本验证多个AI产品创意
  • 为什么封装越优雅的 SQL 跑得越慢?条件下推破解痛点
  • Webpack日志转发插件:将浏览器Console输出实时同步至终端
  • 如何在OpenClaw中配置Taotoken作为其AI能力供应商
  • 清华重磅揭秘:驾驭工程——让AI系统可信可控,引领未来科技新篇章!
  • 2026年4月工业节能风扇厂商推荐,永磁大风扇/工业风扇/工业节能风扇/工业排风扇,工业节能风扇直销厂家怎么选择 - 品牌推荐师
  • 车载以太网之要火系列 - 第36篇:郭大侠学SOME/IP - 忽闻江湖有新令,服务通信破天惊(SOA是个什么鬼)
  • 企业内网开发如何通过Taotoken统一管理多个大模型API密钥
  • ARMv9架构BRBSRC_EL1寄存器原理与应用解析
  • LeetCode 20. 有效的括号
  • 基于Amazon Bedrock与RAG模式构建企业级生成式AI应用实战指南
  • USB 2.0高速连接方案在移动设备中的应用与优化
  • Context7:基于MCP协议为AI编程助手提供实时文档检索,告别代码幻觉
  • ChatGPT在教育领域的应用:机遇、挑战与落地实践
  • CANN驱动DCMI查询AICPU信息文档
  • tmux-watch:实现tmux窗格进程监控与自动化通知的实用工具
  • 从Java到AI大模型:收藏!程序员小白轻松转型指南
  • CANN社区组织管理指南
  • AI艺术审美新标准:从模仿论到观念论的艺术史框架重构
  • AI生图:核心技术与应用场景详解
  • Toggler:基于开关模式的轻量级环境与配置管理工具实践
  • ARM汇编栈帧管理与FUNCTION指令详解
  • ARM架构DC CIGDVAC缓存指令详解与优化实践
  • ZoomingADC技术解析:低成本实现高精度信号采集
  • ComfyUI-IF_AI_tools:AI绘画精准控制的瑞士军刀插件指南
  • Mind Keg MCP:为AI编程助手构建持久化记忆大脑的完整指南
  • 收藏!小白/程序员轻松入门大模型:货拉拉悟空平台功能拓界与业务赋能全解析
  • 模板化开发与可视化设计:新手项目上线完全指南
  • Prompt工程资源聚合:从入门到构建个人AI工作流