当前位置: 首页 > news >正文

CANN/asc-devkit矢量除法API

asc_div

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

功能说明

执行矢量除法运算。计算公式如下:

$$ dst_i = src0_i ÷ src1_i $$

函数原型

  • 前n个数据计算
__aicore__ inline void asc_div(__ubuf__ half* dst, __ubuf__ half* src0, __ubuf__ half* src1, uint32_t count) __aicore__ inline void asc_div(__ubuf__ float* dst, __ubuf__ float* src0, __ubuf__ float* src1, uint32_t count)
  • 高维切分计算
__aicore__ inline void asc_div(__ubuf__ half* dst, __ubuf__ half* src0, __ubuf__ half* src1, uint8_t repeat, uint8_t dst_block_stride, uint8_t src0_block_stride, uint8_t src1_block_stride, uint8_t dst_repeat_stride, uint8_t src0_repeat_stride, uint8_t src1_repeat_stride) __aicore__ inline void asc_div(__ubuf__ float* dst, __ubuf__ float* src0, __ubuf__ float* src1, uint8_t repeat, uint8_t dst_block_stride, uint8_t src0_block_stride, uint8_t src1_block_stride, uint8_t dst_repeat_stride, uint8_t src0_repeat_stride, uint8_t src1_repeat_stride)
  • 同步计算
__aicore__ inline void asc_div_sync(__ubuf__ half* dst, __ubuf__ half* src0, __ubuf__ half* src1, uint32_t count) __aicore__ inline void asc_div_sync(__ubuf__ float* dst, __ubuf__ float* src0, __ubuf__ float* src1, uint32_t count)

参数说明

参数名输入/输出描述
dst输出目的操作数(矢量)的起始地址
src0输入源操作数(矢量)的起始地址
src1输入源操作数(矢量)的起始地址
repeat输入迭代次数。
dst_block_stride输入目的操作数单次迭代内不同DataBlock间地址步长。
src0_block_stride输入源操作数0单次迭代内不同DataBlock间地址步长。
src1_block_stride输入源操作数1单次迭代内不同DataBlock间地址步长。
dst_repeat_stride输入目的操作数相邻迭代间相同DataBlock的地址步长。
src0_repeat_stride输入源操作数0相邻迭代间相同DataBlock的地址步长。
src1_repeat_stride输入源操作数1相邻迭代间相同DataBlock的地址步长。
count输入参与连续计算的元素个数

返回值说明

流水类型

PIPE_V

约束说明

  • dst、src0、src1的起始地址需要32字节对齐。
  • 操作数地址重叠约束请参考通用地址重叠约束。
  • 注意除0错误。

调用示例

//total_length 指参与计算的数据长度 constexpr uint64_t total_length = 64; __ubuf__ half src0[total_length]; __ubuf__ half src1[total_length]; __ubuf__ half dst[total_length]; asc_div(dst, src0, src1, total_length);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/794580/

相关文章:

  • 欧弗星辰:口碑好的美国留学机构 - mypinpai
  • 44《实车CAN总线报文ID含义与数据初步解读》
  • 性价比高的香港留学机构,有哪些推荐 - mypinpai
  • Photonix社区贡献指南:如何参与开源照片管理项目开发与改进
  • 分析河北吉链无忧科技有限公司GEO推广服务是否便宜 - 工业品网
  • CSS Zen Garden社区贡献指南:如何提交你的设计作品
  • WinForm + Modbus 上位机温湿度数据采集系统
  • 物联网设备互通:从技术狂热到务实落地的工程实践与思考
  • 手把手教你用Gazebo+ROS搭建Realsense D435i仿真环境(含VINS-Mono外参标定避坑指南)
  • 2026年AI关键词优化哪家好,合众易联口碑载道 - mypinpai
  • pdd m端响应体解密
  • CherryPy安全最佳实践:防范常见Web攻击的终极指南
  • worker-plugin核心原理解析:Webpack插件如何自动编译Worker模块的完整指南
  • 技术深度解析:RePKG逆向工程与格式解析实现原理
  • CANN/asc-devkit int8转int16 API
  • 医疗AI语音交互系统架构与临床实践优化
  • 基于MCP协议构建本地AI多代理协作平台:Roundtable AI实战指南
  • 时序逻辑与多谓词递归在机器人控制中的应用
  • 2026年美藤嘉国教育奖励学生办法排名,有哪些性价比高的? - mypinpai
  • 2026年|毕业论文必备:5款免费AIGC降重工具,高效降AI率,亲测知网/维普检测全绿通过,告别焦虑 - 降AI实验室
  • SplaTAM性能优化秘籍:提升3D高斯渲染速度的7种方法
  • CANN ops-nn L1损失算子
  • 罗技鼠标宏能否彻底解决PUBG压枪难题?新手必看完整指南
  • ATF IronPython集成:如何在C应用中嵌入Python脚本引擎的完整指南
  • CANN/asc-devkit SIMT API转换函数
  • Kohya Trainer 图像生成实战:利用训练好的模型进行高质量创作
  • 2026年北京能优化户型布局的装修公司性价比 - mypinpai
  • 5分钟快速上手QMCDecode:轻松解锁QQ音乐加密格式,实现音乐自由播放!
  • Apache Atlas UI实战:从数据资产发现到血缘追溯的完整操作指南
  • 2026年4月木屋别墅制造商推荐,木屋别墅,木屋别墅施工企业哪个好 - 品牌推荐师