当前位置: 首页 > news >正文

CANN/pyasc绝对值函数API文档

asc.language.basic.abs

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

asc.language.basic.abs(dst: LocalTensor, src: LocalTensor, count: int) → None

asc.language.basic.abs(dst: LocalTensor, src: LocalTensor, mask: int, repeat_times: int, repeat_params: UnaryRepeatParams, is_set_mask: bool = True) → None

asc.language.basic.abs(dst: LocalTensor, src: LocalTensor, mask: List[int], repeat_times: int, repeat_params: UnaryRepeatParams, is_set_mask: bool = True) → None

按元素取绝对值。

对应的Ascend C函数原型

template <typename T> __aicore__ inline void Abs(const LocalTensor<T>& dstLocal, const LocalTensor<T>& srcLocal, const int32_t& calCount)
template <typename T, bool isSetMask = true> __aicore__ inline void Abs(const LocalTensor<T>& dstLocal, const LocalTensor<T>& srcLocal, uint64_t mask[], const uint8_t repeatTimes, const UnaryRepeatParams& repeatParams)
template <typename T, bool isSetMask = true> __aicore__ inline void Abs(const LocalTensor<T>& dstLocal, const LocalTensor<T>& srcLocal, uint64_t mask, const uint8_t repeatTimes, const UnaryRepeatParams& repeatParams)

参数说明

  • is_set_mask:是否在接口内部设置mask。
  • dst: 目的操作数。类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。
  • src: 源操作数。类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。
  • count: 参与计算的元素个数。
  • mask: 用于控制每次迭代内参与计算的元素。
  • repeat_times: 重复迭代次数。
  • params: 控制操作数地址步长的参数。

约束说明

  • 操作数地址对齐要求请参见 《Ascend C算子开发接口》 中的“通用说明和约束-通用地址对齐约束”。
  • 操作数地址重叠约束请参考 《Ascend C算子开发接口》 中的“通用说明和约束-通用地址重叠约束”。

调用示例

  • tensor高维切分计算样例-mask连续模式
    mask = 256 // asc.half.sizeof() # repeat_times = 4,一次迭代计算128个数,共计算512个数 # dst_blk_stride, src_blk_stride = 1,单次迭代内数据连续读取和写入 # dst_rep_stride, src_rep_stride = 8,相邻迭代间数据连续读取和写入 params = asc.UnaryRepeatParams(1, 1, 8, 8) asc.abs(dst, src, mask=mask, repeat_times=4, repeat_params=params)
  • tensor高维切分计算样例-mask逐bit模式
    mask = [uint64_max, uint64_max] # repeat_times = 4,一次迭代计算128个数,共计算512个数 # dst_blk_stride, src_blk_stride = 1,单次迭代内数据连续读取和写入 # dst_rep_stride, src_rep_stride = 8,相邻迭代间数据连续读取和写入 params = asc.UnaryRepeatParams(1, 1, 8, 8) asc.abs(dst, src, mask=mask, repeat_times=4, repeat_params=params)
  • tensor前n个数据计算样例
    asc.abs(dst, src, count=512)

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/785865/

相关文章:

  • 常见软件测试用例设计方法
  • GESP考级1—8注意事项
  • 第47篇:Vibe Coding时代:LangGraph + 代码回滚机制实战,解决 Agent 修改失败后无法恢复的问题
  • 终极Windows热键冲突检测指南:Hotkey Detective完全解析
  • AI气象预报新突破:FengWu-Adas实现从观测到预报的端到端闭环
  • 网络安全威胁情报分析实战:从IOC管理到TTP追踪的完整技能框架
  • 终结AI模型幻觉:MCP协议服务器实时验证模型ID,提升编码效率
  • 学术界的AI伦理博弈:从ChatGPT看生成式AI在教育中的信任与效率挑战
  • 关于目前C++学士现状分析
  • 聚合统计-原理和应用场景
  • 关系选择器和关系选择器的复合,简单实用快来看一看吖~
  • 2026 AI大模型接口中转站排行榜:哪家平台能为开发者和企业提供最优质服务?
  • Cloudflare Agents Week 2026 总结:20 项发布,一张 Cloud 2.0 的完整地图
  • 专为打工人打造!OpenClaw 中文汉化版部署教程
  • 仙居神仙居旅游核心优势:山水间的诗意栖居与生态人文之旅 - 品牌策略师
  • Apache Airflow 系列教程 | 第24课:监控、指标与可观测性
  • 有哪些专业且非常好用的毕业论文写作辅助生成工具(提纲、初稿、降重、图表公式生成)?
  • 服务器端表单验证
  • 电池清洁度萃取设备与分析仪如何完美协同?西恩士紊流灌流+智能识别标杆方案解析 - 工业设备研究社
  • Windows热键冲突终结者:Hotkey Detective帮你一键揪出占用程序
  • 长沙短视频拍摄哪家更可靠
  • P1228 地毯填补问题【洛谷算法习题】
  • 汽车零部件清洁度萃取设备与分析仪:破解复杂内腔萃取难题 - 工业设备研究社
  • LVGL部分刷新与整屏交换的冲突解析
  • 1.中断的优先级
  • 研发管理工具怎么选?主流工具功能对比、适用场景与选型建议
  • 基于SpringBoot+Vue的求职招聘小程序
  • 有没有能辅助生成论文框架、自动推荐文献的智能写作软件?
  • 实测taotoken在多模型切换时的延迟与稳定性表现
  • 实测Taotoken聚合接口在不同时段的响应延迟表现