当前位置: 首页 > news >正文

CANN/asc-devkit TPipe和TQue加法示例

基于TPipe和TQue的Add样例

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

概述

本样例基于TPipe和TQue的内存和同步管理机制实现Add向量加法操作。

支持的产品

  • Ascend 950PR/Ascend 950DT
  • Atlas A3 训练系列产品/Atlas A3 推理系列产品
  • Atlas A2 训练系列产品/Atlas A2 推理系列产品

目录结构介绍

├── add_tpipe_tque │ ├── scripts │ │ ├── gen_data.py // 输入数据和真值数据生成脚本 │ │ └── verify_result.py // 验证输出数据和真值数据是否一致的验证脚本 │ ├── CMakeLists.txt // 编译工程文件 │ ├── data_utils.h // 数据读入写出函数 │ └── add.asc // Ascend C样例实现,tque管理内存 & 调用样例

样例描述

  • 样例功能:
    计算公式:

    z = x + y
  • 样例规格:

    样例类型(OpType)Add
    样例输入nameshapedata typeformat
    x[8, 2048]floatND
    y[8, 2048]floatND
    样例输出z[8, 2048]floatND
    核函数名add_custom
  • 样例实现:

    • Kernel实现
      使用TPipe和TQue管理内存和同步,完成对输入数据的向量加法操作。

    • 调用实现
      使用内核调用符<<<>>>调用核函数。

编译运行

在本样例根目录下执行如下步骤,编译并执行样例。

  • 配置环境变量
    请根据当前环境上CANN开发套件包的安装方式,选择对应配置环境变量的命令。

    • 默认路径,root用户安装CANN软件包

      source /usr/local/Ascend/cann/set_env.sh
    • 默认路径,非root用户安装CANN软件包

      source $HOME/Ascend/cann/set_env.sh
    • 指定路径install_path,安装CANN软件包

      source ${install_path}/cann/set_env.sh
  • 样例执行

    mkdir -p build && cd build; # 创建并进入build目录 cmake -DCMAKE_ASC_ARCHITECTURES=dav-2201 ..;make -j; # 编译工程(默认npu模式) python3 ../scripts/gen_data.py # 生成测试输入数据 ./demo # 执行编译生成的可执行程序,执行样例 python3 ../scripts/verify_result.py output/output.bin output/golden.bin # 验证输出结果是否正确,确认算法逻辑正确

    使用 CPU调试 或 NPU仿真 模式时,添加-DCMAKE_ASC_RUN_MODE=cpu-DCMAKE_ASC_RUN_MODE=sim参数即可。

    示例如下:

    cmake -DCMAKE_ASC_RUN_MODE=cpu -DCMAKE_ASC_ARCHITECTURES=dav-2201 ..;make -j; # cpu调试模式 cmake -DCMAKE_ASC_RUN_MODE=sim -DCMAKE_ASC_ARCHITECTURES=dav-2201 ..;make -j; # NPU仿真模式

    注意:切换编译模式前需清理 cmake 缓存,可在 build 目录下执行rm CMakeCache.txt后重新 cmake。

  • 编译选项说明

选项可选值说明
CMAKE_ASC_RUN_MODEnpu(默认)、cpusim运行模式:NPU 运行、CPU调试、NPU仿真
CMAKE_ASC_ARCHITECTURESdav-2201(默认)、dav-3510NPU 架构:dav-2201 对应 Atlas A2 训练系列产品/Atlas A2 推理系列产品和Atlas A3 训练系列产品/Atlas A3 推理系列产品,dav-3510 对应 Ascend 950PR/Ascend 950DT
  • 执行结果
    执行结果如下,说明精度对比成功。
    test pass!

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/863563/

相关文章:

  • Sunshine:打造个人专属游戏云,跨设备畅玩3A大作的终极方案
  • Sunshine游戏串流服务器终极指南:如何10分钟搭建个人云游戏平台
  • React Native Orientation iOS配置完全指南:从Xcode设置到AppDelegate集成
  • 中兴光猫终极解锁指南:3分钟开启工厂模式与永久Telnet
  • 智能盒子-Agent-Skill-执行逻辑架构
  • 华硕笔记本终极控制神器:G-Helper轻量化替代方案完整指南
  • 基于微信小程序实现民大食堂用餐综合服务平台管理系统【内附项目源码+论文说明】
  • 建湖县黄金回收哪家强?铭润稳居第一 - 亦辰小黄鸭
  • 解密速度提升300%:音频格式转换工具深度解析
  • 建宁县黄金回收哪家强?铭润稳居第一 - 亦辰小黄鸭
  • BarrageGrab深度解析:构建多平台实时数据采集工具的技术实现
  • 深度解析:罗技鼠标自动化工具在PUBG中的实战应用
  • QQ空间数据备份指南:三步骤永久保存你的数字青春
  • 鸣潮自动化终极指南:3步开启智能游戏体验
  • QMCDecode:3步解锁QQ音乐加密音频的终极解决方案
  • 《Sysinternals实战指南》进程和诊断工具学习笔记(8.32):谁在占用这个文件?用 Handle 精准搜索、定位并释放锁
  • DLSS Swapper完整指南:3分钟掌握游戏性能优化终极技巧
  • Falco 容器安全监控实践:实时威胁检测
  • 抖音下载终极解决方案:免费高效的douyin-downloader完整使用手册
  • 将乐县黄金回收哪家强?铭润稳居第一 - 亦辰小黄鸭
  • 空洞骑士模组管理器Scarab完整指南:从安装到精通的高效解决方案
  • Kill-Doc:彻底解决在线文档下载难题的浏览器脚本解决方案
  • Python金融数据引擎:重构通达信数据获取的技术范式
  • 端到端智能对话系统架构文档
  • 2026年实测AI论文写作软件合集(实测甄选版)
  • 绛县黄金回收哪家强?铭润稳居第一 - 亦辰小黄鸭
  • 2026安平县黄金回收白银回收铂金回收店铺实力排行榜TOP5;K金+金条+银条+首饰回收靠谱门店及联系方式推荐 - 前途无量YY
  • 萤石开放平台 智慧景区精彩视频方案 直播分享
  • BetterNCM Installer:网易云音乐PC版的终极插件管理解决方案
  • 金湖县黄金回收哪家强?铭润稳居第一 - 亦辰小黄鸭