当前位置: 首页 > news >正文

CANN/hccl Scatter算子接口文档

HcclScatter

【免费下载链接】hccl集合通信库(Huawei Collective Communication Library,简称HCCL)是基于昇腾AI处理器的高性能集合通信库,为计算集群提供高性能、高可靠的通信方案项目地址: https://gitcode.com/cann/hccl

产品支持情况

  • Ascend 950PR/Ascend 950DT:支持
  • Atlas A3 训练系列产品/Atlas A3 推理系列产品:支持
  • Atlas A2 训练系列产品/Atlas A2 推理系列产品:支持
  • Atlas 推理系列产品:不支持
  • Atlas 训练系列产品:支持

[!NOTE]说明 针对Atlas A2 训练系列产品/Atlas A2 推理系列产品,仅支持Atlas 800T A2 训练服务器、Atlas 900 A2 PoD 集群基础单元、Atlas 200T A2 Box16 异构子框。

功能说明

集合通信算子Scatter操作接口,将root节点的数据均分并散布至其他rank。

函数原型

HcclResult HcclScatter(void *sendBuf, void *recvBuf, uint64_t recvCount, HcclDataType dataType, uint32_t root, HcclComm comm, aclrtStream stream)

参数说明

参数名输入/输出描述
sendBuf输入源数据buffer地址。
recvBuf输出目的数据buffer地址,集合通信结果输出至此buffer中。
recvCount输入参与scatter操作的recvBuf的数据个数,比如只有一个int32数据参与,则count=1。
dataType输入Scatter操作的数据类型,HcclDataType类型。
针对Ascend 950PR/Ascend 950DT,支持数据类型:int8、uint8、int16、uint16、int32、uint32、int64、uint64、float8-e5m2、float8-e4m3、float8-e8m0、hifloat8、float16、float32、float64、bfp16。
针对Atlas A3 训练系列产品/Atlas A3 推理系列产品,支持数据类型:int8、uint8、int16、uint16、int32、uint32、int64、uint64、float16、float32、float64、bfp16。
针对Atlas A2 训练系列产品/Atlas A2 推理系列产品,支持数据类型:int8、uint8、int16、uint16、int32、uint32、int64、uint64、float16、float32、float64、bfp16。
针对Atlas 训练系列产品,支持数据类型:int8、uint8、int16、uint16、int32、uint32、int64、uint64、float16、float32、float64。
root输入作为scatter root的rank id。
comm输入集合通信操作所在的通信域。
stream输入本rank所使用的stream。

返回值

HcclResult:接口成功返回HCCL_SUCCESS,其他失败。

约束说明

  • 所有rank的recvCount、dataType、root均应相同。
  • 全局只能有1个root节点。
  • 非root节点的sendBuf可以为空。root节点的sendBuf不能为空。

调用示例

void *sendBuf = nullptr; void *recvBuf = nullptr; uint64_t sendCount = 8; uint64_t recvCount = 1; size_t sendSize = sendCount * sizeof(float); size_t recvSize = recvCount * sizeof(float); // 申请 Device 内存用于接收 Scatter 结果 ACLCHECK(aclrtMalloc(&recvBuf, recvSize, ACL_MEM_MALLOC_HUGE_ONLY)); // 在 root 节点,申请 Device 内存用于存放发送数据 if (device == rootRank) { ACLCHECK(aclrtMalloc(&sendBuf, sendSize, ACL_MEM_MALLOC_HUGE_ONLY)); } // 初始化通信域 uint32_t rankSize = 8; HcclComm hcclComm; HcclCommInitRootInfo(rankSize, &rootInfo, device, &hcclComm); // 创建任务流 aclrtStream stream; aclrtCreateStream(&stream); // 执行 Scatter,将通信域内 root 节点的数据均分并散布至其他 rank HcclScatter(sendBuf, recvBuf, recvCount, HCCL_DATA_TYPE_FP32, rootRank, hcclComm, stream); // 阻塞等待任务流中的集合通信任务执行完成 aclrtSynchronizeStream(stream); // 释放资源 aclrtFree(sendBuf); // 释放 Device 侧内存 aclrtFree(recvBuf); // 释放 Device 侧内存 aclrtDestroyStream(stream); // 销毁任务流 HcclCommDestroy(hcclComm); // 销毁通信域

【免费下载链接】hccl集合通信库(Huawei Collective Communication Library,简称HCCL)是基于昇腾AI处理器的高性能集合通信库,为计算集群提供高性能、高可靠的通信方案项目地址: https://gitcode.com/cann/hccl

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/785945/

相关文章:

  • 20254108 2025-2026-2 《Python程序设计》实验3报告
  • 零基础参加高考美术培训,真能如愿逆袭名校吗?
  • Llama 3.2-90B多模态图像理解实战:Groq+Streamlit轻量级部署方案
  • 机器学习赋能系外行星预测:从提丢斯-波得定则到数据驱动模型
  • 2026年沈阳GEO优化服务商推荐top5:专业选型参考与核心实力分析 - 产业观察网
  • 基于LLM的政府信息智能分析系统:从文档解析到洞察生成全流程实践
  • 复合调味料行业标杆推荐:2025年专业生产厂家与定制代加工优选指南 - 品牌策略师
  • 广州十一区工厂搬迁评测:兵哥搬家专业度实测解析 - 奔跑123
  • 维策信息GEO优化口碑如何?创始人11年运营零投诉
  • 机器学习预测系外行星:从TB定律到数据驱动的天文发现
  • 2026年温州GEO优化服务商推荐top5:能力梳理、产业适配与选型参考 - 产业观察网
  • CANN/ops-transformer Chunk_gated_delta_rule算子测试框架
  • AI写专著必备:实测4款工具,快速产出20万字专著,查重不用愁!
  • 厦门装修哪个比较好
  • CANN基础设施OAT使用指南
  • CLAWHunter:基于WiFi Pineapple Pager的OpenClaw AI网关自动化侦察与渗透工具
  • 强化学习算法 —— 带自适应步长的策略梯度算法(PG算法、Adaptive step size for Adam optimizer)
  • cann/sip AsumOperation示例
  • 基于RAG与向量数据库构建个人AI知识库:从KnowMe项目看技术实现
  • CANN/ops-solver Sgetri算子测试
  • 2026年无锡GEO优化行业市场调研及3家优质服务商选型参考指南 - 产业观察网
  • CANN/community持续集成指南
  • AI算法黑箱的法律归责挑战:从技术原理到责任鸿沟
  • 【GaussDB】数据加密方式:函数加密、透明加密与全密态
  • OpenSpeedy终极指南:5分钟掌握免费开源游戏变速技巧
  • 抖音矩阵云混剪系统 源码短视频矩阵营销系统V2.3.0(免授权版)
  • AI赋能建筑工程电气电子工程:从自动化设计到智能运维的实践指南
  • 安达发|APS智能排产排程排单软件:重塑金属加工生产效能
  • 因果图与特征组合:构建人机协同的算法公平性分析工具
  • 终极指南:5分钟搭建个人游戏串流服务器Sunshine,免费玩转3A大作