当前位置: 首页 > news >正文

CANN/asc-devkit Abs-15 API文档

Abs

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品

是否支持

Ascend 950PR/Ascend 950DT

Atlas A3 训练系列产品 / Atlas A3 推理系列产品

x

Atlas A2 训练系列产品 / Atlas A2 推理系列产品

x

功能说明

对srcReg中的有效元素逐个取绝对值,并将结果写入dstReg中对应位置处。

函数原型

template <typename T = DefaultType, MaskMergeMode mode = MaskMergeMode::ZEROING, typename U> __simd_callee__ inline void Abs(U& dstReg, U& srcReg, MaskReg& mask) template <typename T = DefaultType, typename U = DefaultType, MaskMergeMode mode = MaskMergeMode::ZEROING, typename S, typename V> __simd_callee__ inline void Abs(S& dstReg, V& srcReg, MaskReg& mask)

参数说明

表 1模板参数说明

参数名

描述

T

操作数数据类型。

Ascend 950PR/Ascend 950DT,支持的数据类型为:int8_t/int16_t/int32_t/int64_t/half/float。

U

源操作数数据类型。

Ascend 950PR/Ascend 950DT,支持的数据类型为:complex32/complex64;当U为complex32类型时,T必须是half类型;当U为complex64类型时,T必须是float类型。

mode

选择MERGING模式或ZEROING模式。

  • ZEROING模式下,mask未筛选的元素在dstReg中置零。
  • MERGING模式当前不支持。

S

目的操作数的RegTensor类型,例如RegTensor<half>,由编译器自动推导,用户不需要填写。

V

源操作数的RegTensor类型,例如RegTensor<half>,由编译器自动推导,用户不需要填写。

表 2参数说明

参数名

输入/输出

描述

dstReg

输出

目的操作数。

类型为RegTensor。

srcReg

输入

源操作数。

类型为RegTensor。

mask

输入

源操作数元素操作的有效指示,详细说明请参考MaskReg。

返回值说明

约束说明

整型数据的计算结果如果超出数据类型的表示范围会采取非饱和截断,比如int8类型,src为-128,其绝对值128会被截断成-128。

调用示例

template<typename T> __simd_vf__ inline void AbsVF(__ubuf__ T* dstAddr, __ubuf__ T* srcAddr, uint32_t count, uint32_t oneRepeatSize, uint16_t repeatTimes) { AscendC::Reg::RegTensor<T> srcReg; AscendC::Reg::RegTensor<T> dstReg; AscendC::Reg::MaskReg mask; for (uint16_t i = 0; i < repeatTimes; i++) { mask = AscendC::Reg::UpdateMask<T>(count); AscendC::Reg::LoadAlign(srcReg, srcAddr + i * oneRepeatSize); AscendC::Reg::Abs(dstReg, srcReg, mask); AscendC::Reg::StoreAlign(dstAddr + i * oneRepeatSize, dstReg, mask); } } template<typename T, typename U> __simd_vf__ inline void AbsVF(__ubuf__ U* dstAddr, __ubuf__ T* srcAddr, uint32_t count, uint32_t oneRepeatSize, uint16_t repeatTimes) { AscendC::Reg::RegTensor<T> srcReg; AscendC::Reg::RegTensor<U> dstReg; AscendC::Reg::MaskReg mask; for (uint16_t i = 0; i < repeatTimes; i++) { mask = AscendC::Reg::UpdateMask<T>(count); AscendC::Reg::LoadAlign(srcReg, srcAddr + i * oneRepeatSize); AscendC::Reg::Abs(dstReg, srcReg, mask); AscendC::Reg::StoreAlign(dstAddr + i * oneRepeatSize, dstReg, mask); } }

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/784630/

相关文章:

  • Taotoken的APIKey管理与访问控制功能切实提升了安全性
  • CANN/pyasc获取特殊基础配置API文档
  • Claude Code 用户如何通过 Taotoken 解决访问不稳定与额度焦虑
  • 10个Python一行代码实现高效特征选择
  • Qwen3-4B-Thinking-GGUF惊艳效果:Chainlit中实时流式输出+思维链分步高亮展示
  • torchtitan-npu模型自定义框架
  • 当特征有‘团伙’关系时怎么办?用Python的glmnet实现组套索(Group Lasso)进行基因数据分析
  • 生成式AI社会风险评估:从技术原理到治理框架的实践指南
  • 2026年湖南数控机床设计与非标机床外协全链条服务深度指南 - 年度推荐企业名录
  • CANN/pto-isa GEMM示例
  • ARM中断线桥(IWB)架构与中断处理机制详解
  • CANN/cann-bench: ForeachNorm算子
  • NetBox硬件代理:自动化数据中心资产发现与同步实践
  • 2026全场景整合营销广告公司推荐:包揽品牌升级、整合传播! - 品牌种草官
  • LFM2.5-1.2B-Instruct效果展示:金融交易流水异常模式识别问答效果
  • Hotkey Detective:Windows热键冲突排查实用指南
  • 在 Taotoken 模型广场中根据任务与预算选择合适的模型
  • 用ChatGPT生成IRT数据:当大语言模型遇见心理测量学
  • Driver Store Explorer:释放Windows系统盘空间的终极解决方案
  • 从73.7到89.5,HALO 智能体用“轨迹分析“实现了递归自我进化
  • dirsearch 命令行选项详解:基于官方教程
  • CANN/torchtitan-npu版本策略
  • AGI+IoT融合:边缘智能体的关键技术挑战与实践路径
  • CANN/catlass FlashAttention推理
  • 2026人工草坪企业选型指南,采购不踩坑 - 深度智识库
  • StarRocks MCP Server实战:AI助手与数据库的无缝对话
  • 全球高价值公开数据源全景指南:从专利到遥感,数据科学家的实战地图
  • FLUX.1-Krea-Extracted-LoRA效果展示:丝绸面料光泽与褶皱物理模拟
  • Illustrator脚本开发入门:从零写一个‘日期+序列’的防伪码生成器
  • 大模型参数规模与性能的非线性关系:从规模迷信到精准设计