当前位置: 首页 > news >正文

CANN/asc-devkit同步通知API文档

asc_sync_notify

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

功能说明

设置同步标志,通知目标流水线。

函数原型

__aicore__ inline void asc_sync_notify(pipe_t pipe, pipe_t tpipe, event_t id)

参数说明

参数名输入/输出描述
pipe输入源流水线类型。需传入编译期常量。
tpipe输入目标流水线类型。需传入编译期常量。
id输入同步ID。

返回值说明

流水类型

PIPE_S

约束说明

调用示例

// 本例中total_length指参与计算的数据总长度。src0_gm,src1_gm,dst_gm是外部输入的float类型的源操作数、目的操作数,指向GM内存空间。 constexpr uint32_t total_length = 128; __ubuf__ float src0[total_length]; __ubuf__ float src1[total_length]; __ubuf__ float dst[total_length]; asc_copy_gm2ub((__ubuf__ void*)src0, (__gm__ void*)src0_gm, total_length * sizeof(float)); asc_copy_gm2ub((__ubuf__ void*)src1, (__gm__ void*)src1_gm, total_length * sizeof(float)); // 同步操作:数据搬运操作(GM到UB,PIPE_MTE2流水)完成后才能启动计算操作(PIPE_V流水)。 asc_sync_notify(PIPE_MTE2, PIPE_V, EVENT_ID0); asc_sync_wait(PIPE_MTE2, PIPE_V, EVENT_ID0); asc_add(dst, src1, src0, total_length); // 同步操作:计算操作(PIPE_V流水)完成后才能启动数据搬运操作(UB到GM,PIPE_MTE3流水)。 asc_sync_notify(PIPE_V, PIPE_MTE3, EVENT_ID0); asc_sync_wait(PIPE_V, PIPE_MTE3, EVENT_ID0); asc_copy_ub2gm((__gm__ void*)dst_gm, (__ubuf__ void*)dst, blockLength * sizeof(float));

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/862272/

相关文章:

  • MaterialColorsApp UI模式详解:普通模式、菜单栏模式与附加模式对比
  • SDF性能优化终极指南:如何设置分辨率、批处理和多线程加速
  • 健身房会员行为可视化涨点改进 | 全网独家复现,健康洞察实战篇 引入多维度可视化+用户分层分析,助力会员留存、课程优化、个性化指导有效涨点
  • JMeter gRPC Request插件架构解析:动态协议解析与高性能压测实现
  • Android-examples 与现代开发:Compose、Room、Retrofit 集成终极指南 [特殊字符]
  • CANN/pypto:Tensor构造函数
  • MetalNES音频系统深度解析:从APU到DAC的完整信号链
  • CANN/pypto按位右移操作
  • 硬件工程选型解析:钡特电源VB60-24S12LD与金升阳URB2412LD-60WR3同属工业高可靠
  • 为什么选择Octopress:10个让Jekyll博客开发效率翻倍的理由
  • AI视频剪辑系统架构解析:NarratoAI深度技术实践指南
  • 颠覆传统地质建模:如何用Python GemPy在3天内构建复杂地下模型?
  • 告别烦恼!Mac上制作Windows启动盘的最佳解决方案
  • Windows内核安全实战指南:3步实现驱动签名临时绕过
  • NebulaGraph Console终极指南:简单快速掌握图数据库命令行工具
  • 鸿蒙备考题库页面构建:学习进度可视化与练习模式网格设计
  • circumflex 语法高亮功能详解:让评论和文章更易读的终极指南
  • 独角数卡支付系统:构建企业级高可用自动售货解决方案
  • zsh-git-prompt 与 Oh My Zsh 集成:完整安装与配置教程
  • 解密fbcp-ili9341:树莓派SPI显示驱动的5大核心优化技术
  • Musicn性能优化指南:提升下载速度与稳定性的5个技巧
  • 深度解析:ASP.NET Core微服务架构实战手册
  • 企业级微服务架构解决方案:Abp Vnext Pro框架的5大技术优势解析
  • image.nvim API完全手册:从基础操作到高级图像处理
  • 集成网口设计全攻略:带磁性RJ45的选型、PoE适配与EMC布局实战
  • 5分钟快速生成专业README文件:readme-md-generator完全指南
  • 【与我学 ClaudeCode】规划与协调篇 之 Skills:按需加载的领域知识框架
  • feh主题系统完全指南:如何自定义界面外观和风格
  • 鸿蒙备考题库页面构建:今日计划与题目预览模块的详细解析
  • Kubernete