当前位置: 首页 > news >正文

CANN/asc-devkit Query API文档

Query

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品

是否支持

Ascend 950PR/Ascend 950DT

x

Atlas A3 训练系列产品 / Atlas A3 推理系列产品

Atlas A2 训练系列产品 / Atlas A2 推理系列产品

功能说明

查询handleId对应的通信任务已经完成的轮次,最多返回repeat轮。该接口默认在所有核上工作,用户也可以在调用前通过GetBlockIdx指定其在某一个核上运行。

函数原型

__aicore__ inline int32_t Query(HcclHandle handleId)

参数说明

表 1接口参数说明

参数名

输入/输出

描述

handleId

输入

对应通信任务的标识ID,只能使用Prepare原语接口的返回值。

using HcclHandle = int8_t;

返回值说明

  • 返回handleId对应的通信任务已执行的次数,最大值为repeat。
  • 当执行异常时,返回-1。

约束说明

  • 调用本接口前确保已调用过InitV2和SetCcTilingV2接口。
  • 入参handleId只能使用Prepare原语对应接口的返回值。
  • 本接口在AIC核或者AIV核上调用必须与对应的Prepare接口的调用核保持一致。

调用示例

REGISTER_TILING_DEFAULT(ReduceScatterCustomTilingData); //ReduceScatterCustomTilingData为对应算子头文件定义的结构体 GET_TILING_DATA_WITH_STRUCT(ReduceScatterCustomTilingData, tilingData, tilingGM); Hccl hccl; GM_ADDR contextGM = AscendC::GetHcclContext<0>(); // AscendC自定义算子kernel中,通过此方式获取HCCL context hccl.InitV2(contextGM, &tilingData); auto ret = hccl.SetCcTiling(offsetof(ReduceScatterCustomTilingData, mc2CcTiling)); if (ret != HCCL_SUCCESS) { return; } if (AscendC::g_coreType == AIC) { auto repeat = 10; HcclHandle handleId = hccl.ReduceScatter(sendBuf, recvBuf, 100, HcclDataType::HCCL_DATA_TYPE_INT8, HcclReduceOp::HCCL_REDUCE_SUM, repeat); hccl.Commit(handleId ); // 通知服务端可以执行上述的ReduceScatter任务 int32_t finishedCount = hccl.Query(handleId); while (hccl.Query(handleId) < repeat) {} // 等待查询到handleId对应的通信任务执行repeat次 hccl.Finalize(); // 后续无其他通信任务,通知服务端执行上述ReduceScatter任务之后即可以退出 }

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/793445/

相关文章:

  • CANN/ge获取输入格式API
  • Mentalist安全使用规范:合法渗透测试中的字典生成最佳实践
  • Boomerang性能监控最佳实践:20个提升网站速度的关键策略
  • 安全代码沙盒实践:从Docker到seccomp的多层防御架构
  • AI-Trader价格获取系统:实时市场数据获取与处理机制
  • 深入理解kubeaudit审计器:12个核心安全检查项全解析
  • CANN/ops-math reduce_max算子API文档
  • 鸿蒙一气总论(九)
  • 法律即代码:开源项目vericlaw如何用规则引擎实现合同自动化
  • Arm CoreSight调试架构与SW-DP协议详解
  • 别再只会用SQL了!用Neo4j的Cypher语言5分钟搞定社交网络关系分析
  • CANN/asc-devkit矢量右移标量API
  • Swift集成OllamaKit:本地大模型原生应用开发实战指南
  • AI智能体记忆系统设计:从向量检索到生命周期管理的工程实践
  • AI驱动材料发现:从生成模型原理到工程实践全解析
  • ChameleonUltra深度解析:10大核心功能让你成为RFID安全专家
  • 基于Godot引擎的即时战略游戏框架开发实战指南
  • 零基础也能会!药品西林瓶 AI 缺陷检测项目保姆级实战教程
  • CANN/GE图引擎Profiling初始化接口
  • PD分离(Prefill-Decode Disaggregation)技术方案​​
  • Swift原生Ollama客户端库:简化本地大模型集成与流式对话开发
  • AI新闻链接汇总(2026-05-10)
  • CANN/asc-devkit:SetAlignSplit函数
  • 一种小型家用破壁机的设计
  • Open LLM Leaderboard背后的秘密:HuggingFace evaluation-guidebook深度揭秘
  • CANN/Ascend C调试打印API
  • 【信息科学与工程学】计算机科学与自动化——第三十一篇 半导体晶圆制造01(3)
  • CANN/asc-devkit伪量化API文档
  • YOLO26缝合Polarized Self-Attention:极化自注意力在高分辨率图像的降维打击
  • ROS学习(二)