当前位置：首页 > news >正文

CANN/asc-devkit使用TmpBuf实现向量加法

news 2026/6/13 23:13:33

使用TmpBuf实现VectorAdd样例

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言，原生支持C和C++标准规范，主要由类库和语言扩展层构成，提供多层级API，满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

概述

本样例基于TPipe::InitBuffer接口初始化TBuf内存空间，并在计算过程中使用TBuf临时缓冲区进行数据转换，实现了bfloat16_t数据类型的向量加法（Add）样例。

注意：本样例仅适用于基于TPipe和TQue的编程模式。

本样例支持的产品及CANN软件版本

产品	CANN软件版本
Ascend 950PR/Ascend 950DT	>= CANN 9.1.0
Atlas A3 训练系列产品/Atlas A3 推理系列产品	>= CANN 9.0.0
Atlas A2 训练系列产品/Atlas A2 推理系列产品	>= CANN 9.0.0

目录结构介绍

├── tmp_buffer │ ├── scripts │ │ ├── gen_data.py // 输入数据和真值数据生成脚本 │ │ └── verify_result.py // 验证输出数据和真值数据是否一致的验证脚本 │ ├── CMakeLists.txt // 编译工程文件 │ ├── data_utils.h // 数据读入写出函数 │ ├── tmp_buffer.asc // Ascend C样例实现 & 调用样例 │ └── README.md // 样例说明文档

样例描述

样例功能
本样例调用Cast接口将bfloat16_t类型的输入数据转换为float类型存入TBuf临时缓冲区，完成Add计算后再调用Cast接口转换回bfloat16_t类型。
样例规格
样例类型(OpType) Add
样例输入 name shape data type format
x [1, 2048] bfloat16_t ND
y [1, 2048] bfloat16_t ND
样例输出 z [1, 2048] bfloat16_t ND
核函数名 tmp_buffer_custom
样例实现
- Kernel实现
  - 调用TPipe::InitBuffer接口，为TQue和TBuf分配内存空间，其中TBuf用于存储临时数据。
  - 调用DataCopy基础API，将数据从GM（Global Memory）搬运到UB（Unified Buffer）。
  - 调用Cast接口，将bfloat16_t类型数据转换为float类型并存入TBuf临时缓冲区。
  - 调用Add接口，对两个输入tensor执行加法操作。
  - 调用Cast接口，将float类型的计算结果转换为bfloat16_t类型并存入TQue分配的UB（Unified Buffer）空间。
  - 调用DataCopy基础API，将计算结果从UB（Unified Buffer）搬运至GM（Global Memory）。
- 调用实现
  使用内核调用符<<<>>>调用核函数。

编译运行

在本样例根目录下执行如下步骤，编译并执行样例。

配置环境变量
请根据当前环境上CANN开发套件包的安装方式，配置环境变量。
```
source ${install_path}/cann/set_env.sh
```
说明：${install_path}为CANN包安装目录，未指定安装目录时默认安装至/usr/local/Ascend下。

样例执行

在本样例目录下执行如下命令。

mkdir -p build && cd build; # 创建并进入build目录 cmake -DCMAKE_ASC_ARCHITECTURES=dav-2201 ..;make -j; # 编译工程，默认npu模式 python3 ../scripts/gen_data.py # 生成测试输入数据 ./demo # 执行编译生成的可执行程序，执行样例 python3 ../scripts/verify_result.py output/output.bin output/golden.bin # 验证输出结果是否正确

使用 CPU调试或 NPU仿真模式时，添加-DCMAKE_ASC_RUN_MODE=cpu或-DCMAKE_ASC_RUN_MODE=sim参数即可。

示例如下：

cmake -DCMAKE_ASC_RUN_MODE=cpu -DCMAKE_ASC_ARCHITECTURES=dav-2201 ..;make -j; # cpu调试模式 cmake -DCMAKE_ASC_RUN_MODE=sim -DCMAKE_ASC_ARCHITECTURES=dav-2201 ..;make -j; # NPU仿真模式

注意：切换编译模式前需清理 cmake 缓存，可在 build 目录下执行rm CMakeCache.txt后重新 cmake。

编译选项说明

选项	可选值	说明
`CMAKE_ASC_RUN_MODE`	`npu`（默认）、`cpu`、`sim`	运行模式：NPU 运行、CPU调试、NPU仿真
`CMAKE_ASC_ARCHITECTURES`	`dav-2201`（默认）、`dav-3510`	NPU 架构：dav-2201 对应 Atlas A2 训练系列产品/Atlas A2 推理系列产品和 Atlas A3 训练系列产品/Atlas A3 推理系列产品，dav-3510 对应 Ascend 950PR/Ascend 950DT

执行结果
执行结果如下，说明精度对比成功：
```
test pass!
```

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

查看全文

http://www.jsqmd.com/news/1008149/

武汉燃气灶打不着火怎么办？原因排查与维修平台实测对比 - 简单到家

Wwise音频文件终极指南：5步掌握游戏音频解包与替换技术

2026实力之选：合肥/西安名包回收公司专业评估与运营格局解析 - 品牌发掘

2026 南京石材 / PVC / 地毯清洗 TOP4 权威推荐 + 避坑指南（全区域服务） - 本地便民网

2026年6月水管维修平台横评：4大品牌实测对比 - 简单到家

LS1046A AXI总线时序检查与DMA性能监控实战指南

南京防水补漏公司可以选择哪家适合屋面防水，卫生间防水，外墙防水，地下室防水，隧道管廊堵漏加固等 - 本地便民网

2026母牛羊饲料：解读行业三大核心发展趋势 - 资讯速览

【电力系统】大规模电动汽车开发与电网资源分配的蒙特卡罗Matlab模拟

2026优选：合肥/天津劳力士回收公司的专业评估与高价变现实力解析 - 品牌发掘

如何快速掌握F3D：5个技巧让你成为3D文件查看专家

【Java 入门 Day18】常用类篇（下）：String 可变字符串 BigDecimal，开发里的 “字符串工具人”！

终极指南：用MAA明日方舟助手实现全日常一键长草

2026 河南粮油机械厂商选型参考：油脂全套加工设备厂家梳理指南 - 海棠依旧大

3步掌握个人数据主权：WeChatMsg让您的微信记忆永久留存

2026年6月武汉燃气灶维修平台横评：4大品牌实测，哪家更靠谱？ - 简单到家

抖音无水印下载器完全指南：5分钟掌握批量下载技巧

packwiz 模组包导出教程：如何将包发布到 CurseForge 和 Modrinth

Infinite Noise TRNG安全最佳实践：保护你的随机数生成

ABAP财务开发必知：OB52账期表T001B字段全解析与实战查询技巧

Windows 11系统优化神器：一键清理让你的电脑重获新生

母牛羊饲料常见问题解答（2026最新专家版） - 资讯速览

【车辆】基于110cc全地形车（ATV）平台开发的自主无人地面车辆（UGV）设计与实现

专业音频格式转换深度解析：NCMconverter技术实现与实战指南

116、【Agent】【OpenCode】项目配置（SemVer）（补充）

2026年6月西安冰箱维修平台横评：4大品牌实测，哪家更靠谱？ - 简单到家

【篮球英语】17 比赛战术：从挡拆到区域联防

i.MX23 LCDIF接口深度解析：四种工作模式、数据通路与实战避坑指南

终极指南：如何在安卓手机上为星露谷物语安装MOD？SMAPI安卓安装器完整教程

样例类型(OpType)	Add
样例输入	name	shape	data type	format
	x	[1, 2048]	bfloat16_t	ND
	y	[1, 2048]	bfloat16_t	ND
样例输出	z	[1, 2048]	bfloat16_t	ND
核函数名	tmp_buffer_custom

使用TmpBuf实现VectorAdd样例

概述

本样例支持的产品及CANN软件版本

目录结构介绍

样例描述

编译运行

相关文章：