当前位置: 首页 > news >正文

CANN/asc-devkit LeakyReLU矢量计算API

asc_leakyrelu

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

功能说明

执行矢量Leaky Relu运算。计算公式如下:

$$ dst_i = \begin{cases} src_i ,\quad src_i>0\ \alpha src_i, \quad src_i\le0& \end{cases} $$

函数原型

  • 前n个数据计算

    __aicore__ inline void asc_leakyrelu(__ubuf__ half* dst, __ubuf__ half* src, half value, uint32_t count) __aicore__ inline void asc_leakyrelu(__ubuf__ float* dst, __ubuf__ float* src, float value, uint32_t count)
  • 高维切分计算

    __aicore__ inline void asc_leakyrelu(__ubuf__ half* dst, __ubuf__ half* src, half value, uint8_t repeat, uint16_t dst_block_stride, uint16_t src_block_stride, uint16_t dst_repeat_stride, uint16_t src_repeat_stride) __aicore__ inline void asc_leakyrelu(__ubuf__ float* dst, __ubuf__ float* src, float value, uint8_t repeat, uint16_t dst_block_stride, uint16_t src_block_stride, uint16_t dst_repeat_stride, uint16_t src_repeat_stride)
  • 同步计算

    __aicore__ inline void asc_leakyrelu_sync(__ubuf__ half* dst, __ubuf__ half* src, half value, uint32_t count) __aicore__ inline void asc_leakyrelu_sync(__ubuf__ float* dst, __ubuf__ float* src, float value, uint32_t count)

参数说明

参数名输入/输出描述
dst输出目的操作数(向量)的起始地址。
src输入源操作数(矢量)的起始地址,为待处理数据。
value输入源操作数(标量),leaky_relu中alpha的值。
count输入参与计算的元素个数。
dst_block_stride输入目的操作数单次迭代内不同DataBlock间地址步长。
src_block_stride输入源操作数0单次迭代内不同DataBlock间地址步长。
dst_repeat_stride输入目的操作数相邻迭代间相同DataBlock的地址步长。
src_repeat_stride输入源操作数0相邻迭代间相同DataBlock的地址步长。
repeat输入迭代次数。

返回值说明

流水类型

PIPE_V

约束说明

  • 操作数地址重叠约束请参考通用地址重叠约束。
  • dst、src的起始地址需要32字节对齐。

调用示例

//total_length 指参与计算的数据长度 constexpr uint64_t total_length = 64; half alpha = 0.1; ___ubuf__ half src[total_length]; ___ubuf__ half dst[total_length]; asc_leakyrelu_sync(dst, src, alpha, total_length);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/796097/

相关文章:

  • 2026年贵阳室内装修全案设计深度横评:从毛坯到精装,一站式破解设计落地难、预算超支、工程隐患三大痛点 - 企业名录优选推荐
  • 五年磨一剑:我把交易系统改了4次,终于做到稳定盈利 - Leone
  • 终极音乐解密方案:Unlock Music浏览器端免费解锁加密音频文件
  • 西安台历挂历厂家与快印服务2026年深度评测:松林森彩横评指南 - 优质企业观察收录
  • 告别全局代理!手把手教你用Python脚本精准控制EasyConnect路由(Windows版)
  • 如何轻松保存B站缓存视频:m4s转MP4的完整解决方案
  • 2026年西安画册印刷厂深度横评:如何找到真正靠谱的高新技术印刷企业 - 优质企业观察收录
  • 2026年5月合肥儿童摄影排行|红黄蓝儿童摄影榜首,儿童 / 孕妇 / 全家福优选品牌 - damaigeo
  • 2026年贵阳室内装修全案设计深度横评:从预算陷阱到高端定制的省心之选 - 企业名录优选推荐
  • 如何用League Akari提升英雄联盟游戏体验:完整实用指南
  • mitojs性能监控终极指南:深入解析FCP、FID、LCP、CLS四大核心指标
  • 2026年贵阳室内装修全案设计深度横评:从设计落地到一站式整装,五大品牌透明决算对标指南 - 企业名录优选推荐
  • 综合配套对比:湖景社区的全方位优势解析 - 品牌2026
  • 大庆市窗老大门窗维修:大庆专业的阳台窗户防水公司 - LYL仔仔
  • 2026年国内洗头洗脸SPA店加盟品牌综合实力排行 - 奔跑123
  • 个性化推荐翻车现场:避开这3个坑,让你的习题推荐系统不再“智障”
  • 别再死记硬背了!用STM32 HAL库+逻辑分析仪,5分钟搞懂I2C时序波形
  • 从Maven到IDEA:手把手教你统一项目JDK版本,根治‘源值1.5‘警告(附排查清单)
  • Python自动化查验发票的避坑指南:从安装根证书到对接打码平台(超级鹰)
  • 交易计划模板 - Leone
  • 碧蓝航线终极皮肤解锁指南:Perseus补丁完整配置教程
  • 湖景养老度假社区配套对比:哪个项目的交通体系更完善? - 品牌2026
  • 油雾净化器十大品牌TOP2揭晓:从质量到售后,哪家最值得买? - 品牌推荐大师
  • 价格便宜≠质量差!振荡培养箱哪个厂家交货快又靠谱? - 品牌推荐大师
  • HEIF Utility:打通苹果与Windows的图像桥梁,零成本解决跨平台图片兼容难题
  • Pearcleaner:macOS终极免费应用清理工具,彻底释放磁盘空间
  • 如何用Python工具实现百度网盘高速下载:完整指南与实战教程
  • 多本核心期刊收紧初审标准!文献综述单薄直接秒拒?实测8款AI期刊论文工具帮你紧急“补课” - 逢君学术-AI论文写作
  • 42.从可扩展性与可维护性角度看,为什么很多团队会选 shadcn/ui
  • Betaflight黑匣子功能完全指南:从入门到精通的飞行数据分析