当前位置: 首页 > news >正文

CANN/hccl:rank table配置资源信息(Atlas 300I Duo 推理卡)

rank table配置资源信息(Atlas 300I Duo 推理卡)

【免费下载链接】hccl集合通信库(Huawei Collective Communication Library,简称HCCL)是基于昇腾AI处理器的高性能集合通信库,为计算集群提供高性能、高可靠的通信方案项目地址: https://gitcode.com/cann/hccl

针对Atlas 300I Duo 推理卡,以包含两个AI Server,每个AI Server内2个Device为例,rank table文件配置示例如下:

[!NOTE]说明 rank table文件为JSON格式,本节所示JSON文件示例中的注释仅为方便理解,实际使用时,请删除JSON文件中的注释。

{ "status":"completed", // rank table可用标识,completed为可用 "version":"1.0", // rank table模板版本信息,配置为:1.0 "server_count":"2", // 参与训练的AI Server数目,此例中,有两个AI Server "server_list": [ { "server_id":"node_0", //AI Server标识,String类型,请确保全局唯一 "device":[ // AI Server中的Device列表 { "device_id":"0", // 处理器的物理ID "device_ip":"192.168.1.8", // 处理器真实网卡IP "rank_id":"0" // rank的标识,从0开始配置,请确保全局唯一 }, { "device_id":"1", "device_ip":"192.168.1.9", "rank_id":"1" } ] }, { "server_id":"node_1", "device":[ { "device_id":"0", "device_ip":"192.168.2.8", "rank_id":"2" }, { "device_id":"1", "device_ip":"192.168.2.9", "rank_id":"3" } ] } ] }

rank table配置文件说明如下所示:

一级配置项二级配置项三级配置项配置说明
status必选。
rank table可用标识。
- completed:表示rank table可用。
- initializing:表示rank table不可用。
version必选。
rank table模板版本信息。
配置为:1.0。
server_count必选。
参与集合通信的AI Server个数。
server_list必选。
参与集合通信的AI Server列表。
server_id必选。
AI Server标识,字符串类型,长度小于等于64,请确保全局唯一。
配置示例:node_0。
device必选。
AI Server中的Device列表。
device_id必选。
AI处理器的物理ID,即Device在AI Server上的序列号。
可通过执行“ls /dev/davinci*”命令获取AI处理器的物理ID。
例如:显示/dev/davinci0,表示AI处理器的物理ID为0。
取值范围:[0,实际Device数量-1]。
注意:“device_id”配置项的优先级高于环境变量“ASCEND_DEVICE_ID”。
device_ip必选。
AI处理器集成网卡IP,全局唯一,要求为常规IPv4或IPv6格式。
可以在当前AI Server执行指令“cat /etc/hccn.conf”获取网卡IP,例如:
address_0=xx.xx.xx.xx
netmask_0=xx.xx.xx.xx
netdetect_0=xx.xx.xx.xx
查询到的address_xx即为网卡IP,address后的序号为AI处理器的物理ID,即device_id,后面的ip地址即为需要用户填入的该device对应的网卡IP。
rank_id必选。
rank唯一标识,请配置为整数,从0开始配置,且全局唯一,取值范围:[0, 总Device数量-1]
为方便管理,建议rank_id按照Device物理连接顺序进行排序,即将物理连接上较近的Device编排在一起。
例如,若device_ip按照物理连接从小到大设置,则rank_id也建议按照从小到大的顺序设置。

【免费下载链接】hccl集合通信库(Huawei Collective Communication Library,简称HCCL)是基于昇腾AI处理器的高性能集合通信库,为计算集群提供高性能、高可靠的通信方案项目地址: https://gitcode.com/cann/hccl

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/784710/

相关文章:

  • 2026 深圳黄金奢侈品权威排名,全国连锁正规老店收的顶第一 - 奢侈品回收测评
  • 中医执医培训机构哪个好?四个“硬指标”帮你筛出靠谱选择 - 医考机构品牌测评专家
  • CANN/cann-samples HiFloat8介绍
  • 快手去水印免费软件有哪些?快手如何去掉水印?2026最新实测免费工具推荐 - 爱上科技热点
  • CANN/ops-math MaskedSelectV3算子
  • 河北联邦外国语学校2026年最新学费及配套价值实测评测 - 奔跑123
  • 2026年4月行业内诚信的激光熔覆厂家推荐,激光熔覆,激光熔覆工厂怎么选择 - 品牌推荐师
  • 考临床执医听谁的课?零基础、在职考生匹配适合自己的阿虎老师 - 医考机构品牌测评专家
  • 鸿蒙PC多端适配的断点设计与布局策略
  • CANN/ge RT2运行时约束
  • 2026年园林古建筑工程公司最新推荐榜:古建修缮/仿古建材供应/古建安装/景观古建/古建装饰 - 海棠依旧大
  • 高质量开放数据源指南:生命科学、零售与物流领域实战解析
  • 佛山黄金回收上门天花板!收的顶30年老店垄断TOP1,免费上门秒到账 - 奢侈品回收测评
  • 行业标杆之作!2026广州晶石压电式石英传感器,重新定义传感设备品质标准 - 品牌速递
  • AI伦理挑战:从数据偏见、环境成本到治理困境的深度解析
  • 鸿蒙pc中权限申请流程与用户拒绝处理
  • 质量好+服务优!2026广州晶石不停车高速超限检测系统,成为行业推荐之选 - 品牌速递
  • 即梦AI视频怎么去水印?2026最新手机去水印最实用方法全解析 - 爱上科技热点
  • 多款去水印软件测评 选出去除效果干净的工具 - 爱上科技热点
  • perf热点找到热进程5 - 小镇
  • AI赋能法律行业:从大模型到司法实践的技术路径与挑战
  • 品牌营销全案策划公司三巨头 - 品牌速递
  • 使用taotoken后我的大模型api调用延迟与稳定性体感观察
  • 快手去水印免费软件有哪些?手机版电脑版都能用的去水印工具 2026 实测推荐技巧 - 爱上科技热点
  • CANN/ops-tensor项目目录
  • 2026工业超声波搅拌机/搅拌罐选购指南:核心要点与优质品牌全解析 - 品牌推荐大师1
  • 2026石英称重传感器品牌排行榜,广州晶石领跑行业 - 品牌速递
  • 2026年上海嘉定装修服务商最新推荐:上海合饰装饰设计工程,嘉定家装、嘉定老房翻新、嘉定全屋整装,以靠谱服务守护居家品质 - 海棠依旧大
  • 《什么是文档 Diff?5 分钟搞懂文件比对的核心原理》
  • 多模态AGI在教育领域的应用:从文本理解到视觉生成的智能助教