当前位置: 首页 > news >正文

CANN/pyasc max函数API文档

asc.language.basic.max

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

asc.language.basic.max(dst: LocalTensor, src0: LocalTensor, src1: LocalTensor, count: int, is_set_mask: bool = True) → None

asc.language.basic.max(dst: LocalTensor, src0: LocalTensor, src1: LocalTensor, mask: int, repeat_times: int, repeat_params: BinaryRepeatParams, is_set_mask: bool = True) → None

asc.language.basic.max(dst: LocalTensor, src0: LocalTensor, src1: LocalTensor, mask: List[int], repeat_times: int, repeat_params: BinaryRepeatParams, is_set_mask: bool = True) → None

按元素求最大值。

对应的Ascend C函数原型

template <typename T> __aicore__ inline void Max(const LocalTensor<T>& dst, const LocalTensor<T>& src0, const LocalTensor<T>& src1, const int32_t& count);
template <typename T, bool isSetMask = true> __aicore__ inline void Max(const LocalTensor<T>& dst, const LocalTensor<T>& src0, const LocalTensor<T>& src1, uint64_t mask[], const uint8_t repeatTimes, const BinaryRepeatParams& repeatParams);
template <typename T, bool isSetMask = true> __aicore__ inline void Max(const LocalTensor<T>& dst, const LocalTensor<T>& src0, const LocalTensor<T>& src1, uint64_t mask, const uint8_t repeatTimes, const BinaryRepeatParams& repeatParams);

参数说明

  • dst:目的操作数。类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。
  • src0, src1:源操作数。类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。
  • count:参与计算的元素个数。
  • mask:用于控制每次迭代内参与计算的元素。
  • repeat_times:重复迭代次数。
  • params:控制操作数地址步长的参数。
  • is_set_mask: 是否在接口内部设置mask。

约束说明

  • 操作数地址对齐要求请参见 《Ascend C算子开发接口》 中的“通用说明和约束-通用地址对齐约束”。
  • 操作数地址重叠约束请参考 《Ascend C算子开发接口》 中的“通用说明和约束-通用地址重叠约束”。
  • 使用整个tensor参与计算接口符号重载时,运算量为目的LocalTensor的总长度。

调用示例

  • tensor高维切分计算样例-mask连续模式
    mask = 128 # repeat_times = 4,一次迭代计算128个数,共计算512个数 # dst_blk_stride, src0_blk_stride, src1_blk_stride = 1,单次迭代内数据连续读取和写入 # dst_rep_stride, src0_rep_stride, src1_rep_stride = 8,相邻迭代间数据连续读取和写入 params = asc.BinaryRepeatParams(1, 1, 1, 8, 8, 8) asc.max(dst, src0, src1, mask=mask, repeat_times=4, repeat_params=params)
  • tensor高维切分计算样例-mask逐bit模式
    mask = [uint64_max, uint64_max] # repeat_times = 4,一次迭代计算128个数,共计算512个数 # dst_blk_stride, src0_blk_stride, src1_blk_stride = 1,单次迭代内数据连续读取和写入 # dst_rep_stride, src0_rep_stride, src1_rep_stride = 8,相邻迭代间数据连续读取和写入 params = asc.BinaryRepeatParams(1, 1, 1, 8, 8, 8) asc.max(dst, src0, src1, mask=mask, repeat_times=4, repeat_params=params)
  • tensor前n个数据计算样例
    asc.max(dst, src0, src1, count=512)

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/785463/

相关文章:

  • AI赋能技术债务管理:从识别到治理的实战指南
  • 2026年论文引言部分AI率偏高攻略:引言绪论章节免费降AI处理知网达标完整操作指南
  • CANN ops-fft算子调用指南
  • 在 Node.js 后端服务中快速集成 Taotoken 提供的 Claude 模型
  • python 多线程join如何让他不要卡住控制台
  • 如何为你的Python项目接入多个大模型API并统一管理调用
  • 2026 年浦口区 GEO 优化公司深度测评:南京赢之乐信息科技领跑本土合规赛道 - 小艾信息发布
  • AI赋能非洲农业:轻量级技术方案与本地化实践
  • 内容创作团队如何利用 Taotoken 聚合不同模型特长提升稿件生成质量
  • 别再让电机乱跑了!用Arduino和A4950给直流减速电机做个“速度管家”(附完整代码)
  • OPC UA协议在工业场景的标准化应用:工业通信的“普通话“
  • Excel 行与列相关的函数
  • 普宁脱发白发理疗哪家效果好?黑奥秘90秒精准溯源,精准科学护理头发 - 美业信息观察
  • 从公式到图形:一步步拆解非对称3-SPR机器人工作空间的Matlab仿真流程(附完整代码)
  • 20253902 吴晨宇 2025-2026-2 《网络攻防实践》第七周作业
  • 保姆级教程:用Python和Pandas快速上手Argoverse2数据集(附代码避坑指南)
  • 微信双开终极指南:3步解锁平板模式,实现手机平板同时登录
  • 发个HTTP请求就蓝屏?MS15-034内核漏洞实战:从POC到补丁防御
  • 300GB Procreate插画教程合集零基础到接稿
  • AI Agent参与软件开发遇挑战,UModel代码知识图谱助力AI原生软件工程
  • MPAI-EEV:AI端到端视频编码如何重塑视频压缩技术格局
  • 20251917李鑫明-实践七 Linux系统攻防
  • AEC行业AI与机器人伦理挑战:安全、公平与治理框架
  • Redis学习5 分布式缓存(下)
  • 深度学习在眼科AI诊断中的应用:从模型构建到临床落地
  • KITTI不够用?深度评测ORFD:这个专为越野打造的免费数据集到底香不香
  • meituan mtgsig1.2
  • CANN/pyasc架构介绍
  • cann/sip asdConvolve卷积滤波算子
  • 2026 年鼓楼区 GEO 优化公司深度测评:南京赢之乐凭本土深耕与合规技术领跑 - 小艾信息发布