CANN/hcomm获取本地rank大小
get_local_rank_size
【免费下载链接】hcommHCOMM(Huawei Communication)是HCCL的通信基础库,提供通信域以及通信资源的管理能力。项目地址: https://gitcode.com/cann/hcomm
产品支持情况
- Ascend 950PR/Ascend 950DT:支持
- Atlas A3 训练系列产品/Atlas A3 推理系列产品:支持
- Atlas A2 训练系列产品/Atlas A2 推理系列产品:支持
- Atlas 推理系列产品:支持
- Atlas 训练系列产品:支持
[!NOTE]说明 针对Atlas A2 训练系列产品/Atlas A2 推理系列产品,仅支持Atlas 800T A2 训练服务器、Atlas 900 A2 PoD 集群基础单元、Atlas 200T A2 Box16 异构子框。 针对Atlas 推理系列产品,仅支持Atlas 300I Duo 推理卡。
功能说明
获取group内device所在服务器内的local rank数量。
函数原型
def get_local_rank_size(group="hccl_world_group")参数说明
| 参数名 | 输入/输出 | 描述 |
|---|---|---|
| group | 输入 | String类型,最大长度为128字节,含结束符。 group名称,如果用户不配置此参数,默认为“hccl_world_group”。 |
返回值
int类型,返回device所在服务器内的local rank数量。
约束说明
- 必须在集合通信初始化完成之后调用。
- 调用该接口的rank必须在当前接口入参group定义的范围内,不在此范围内的rank调用该接口会失败。
- create_group完成之后,调用此API获取本group的local rank数量。
- 如果传入"hccl_world_group",返回world_group的local rank数量。
调用示例
from hccl.manage.api import create_group from hccl.manage.api import get_local_rank_size create_group("myGroup", 4, [0, 1, 2, 3]) localRankSize = get_local_rank_size("myGroup")【免费下载链接】hcommHCOMM(Huawei Communication)是HCCL的通信基础库,提供通信域以及通信资源的管理能力。项目地址: https://gitcode.com/cann/hcomm
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考
