当前位置: 首页 > news >正文

CANN/pyasc向量标量最大值API

asc.language.basic.maxs

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

asc.language.basic.maxs(dst: LocalTensor, src: LocalTensor, scalar: int | float, count: int, is_set_mask: bool = True) → None

asc.language.basic.maxs(dst: LocalTensor, src: LocalTensor, scalar: int | float, mask: int, repeat_times: int, repeat_params: UnaryRepeatParams, is_set_mask: bool = True) → None

asc.language.basic.maxs(dst: LocalTensor, src: LocalTensor, scalar: int | float, mask: List[int], repeat_times: int, repeat_params: UnaryRepeatParams, is_set_mask: bool = True) → None

源操作数矢量内每个元素与标量相比,如果比标量大,则取源操作数值,比标量的值小,则取标量值。

对应的Ascend C函数原型

template <typename T, bool isSetMask = true> __aicore__ inline void Maxs(const LocalTensor<T>& dstLocal, const LocalTensor<T>& srcLocal, const T& scalarValue, const int32_t& calCount)
template <typename T, bool isSetMask = true> __aicore__ inline void Maxs(const LocalTensor<T>& dstLocal, const LocalTensor<T>& srcLocal, const T& scalarValue, uint64_t mask[], const uint8_t repeatTimes, const UnaryRepeatParams& repeatParams)
template <typename T, bool isSetMask = true> __aicore__ inline void Maxs(const LocalTensor<T>& dstLocal, const LocalTensor<T>& srcLocal, const T& scalarValue, uint64_t mask, const uint8_t repeatTimes, const UnaryRepeatParams& repeatParams)

参数说明

  • is_set_mask:是否在接口内部设置mask模式和mask值。
  • dst:目的操作数。类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。
  • src:源操作数。类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。
  • scalar:源操作数,数据类型需要与目的操作数中的元素类型保持一致。
  • count:参与计算的元素个数。
  • mask:用于控制每次迭代内参与计算的元素。
  • repeat_times:重复迭代次数。
  • params:元素操作控制结构信息。

约束说明

  • 操作数地址对齐要求请参见 《Ascend C算子开发接口》 中的“通用说明和约束-通用地址对齐约束”。
  • 操作数地址重叠约束请参考 《Ascend C算子开发接口》 中的“通用说明和约束-通用地址重叠约束”。

调用示例

  • tensor高维切分计算样例-mask连续模式
    mask = 128 scalar = 2 # repeat_times = 4,一次迭代计算128个数,共计算512个数 # dst_blk_stride, src_blk_stride = 1,单次迭代内数据连续读取和写入 # dst_rep_stride, src_rep_stride = 8,相邻迭代间数据连续读取和写入 params = asc.UnaryRepeatParams(1, 1, 8, 8) asc.maxs(dst, src, scalar, mask=mask, repeat_times=4, repeat_params=params)
  • tensor高维切分计算样例-mask逐bit模式
    mask = [uint64_max, uint64_max] scalar = 2 # repeat_times = 4,一次迭代计算128个数,共计算512个数 # dst_blk_stride, src_blk_stride = 1,单次迭代内数据连续读取和写入 # dst_rep_stride, src_rep_stride = 8,相邻迭代间数据连续读取和写入 params = asc.UnaryRepeatParams(1, 1, 8, 8) asc.maxs(dst, src, scalar, mask=mask, repeat_times=4, repeat_params=params)
  • tensor前n个数据计算样例
    asc.maxs(dst, src, scalar, count=512)

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/786232/

相关文章:

  • AI与逻辑回归模型在抗生素耐药性风险预测与临床决策中的应用
  • 10x-Agent-Loop:突破AI编程助手配额限制的智能缓存与调度方案
  • 2026年现阶段,哈尔滨抖音代运营服务商如何选?深度解析哈尔滨翰诺网络科技有限公司 - 2026年企业推荐榜
  • RAG系统交互式调试:从黑盒到白盒的工程实践指南
  • 大模型API聚合服务:一站式解决多模型接入难题
  • 自动驾驶AI算法演进:从规则驱动到数据驱动的工程实践与挑战
  • AI工作流集成:从自动化到智能化的任务处理系统构建
  • AIGC产品可解释性设计:从黑箱魔法到透明协作伙伴
  • 可控RAG智能体:基于确定性图与多层检索的复杂问题求解框架
  • 基于ChatGPT API构建个性化聊天机器人:从零到部署完整指南
  • 机器学习力场实战:从原理到应用,构建高精度分子动力学模型
  • ChatGemini部署指南:基于React与反向代理的Gemini AI客户端实战
  • 认知科学启发AI感知:从大脑原理到工程实践
  • AI数字病理诊断系统综述与Meta分析:方法、挑战与临床转化
  • 基于点空间注意力机制(PSAM)的图像分割边界优化实战
  • 深度强化学习优化量子比特反馈控制:从DQN原理到实验部署
  • 为OpenClaw智能体工作流配置Taotoken作为可靠模型供应商
  • CANN/asc-devkit Async函数API文档
  • 【准Z源直流-直流变换器】具有单个开关电容支路的高增益准Z源直流-直流变换器研究(Simulink仿真实现)
  • 对话式AI如何隐秘引导消费决策:行为心理学实验揭示四大机制
  • MI-CLAIM-GEN:临床生成式AI研究的透明化报告清单深度解析
  • 实测 Taotoken 多模型路由在不同时段的响应延迟与稳定性
  • CANN/graph-autofusion自动融合组件
  • 生成式AI时代职场生存指南:技能重塑与人机协同实践
  • CANN/pypto设置卷积Tile形状
  • 基于拓扑数据分析的纳米图像去噪:原理、实践与动态结构研究
  • Web代理逆向工程:从协议分析到客户端架构的技术实践与风险
  • 使用codeskeleton构建代码知识图谱:可视化架构与识别隐藏依赖
  • AI技术如何驱动可持续发展:从数据到决策的绿色引擎
  • 基于Claude API与Telegram Bot构建私有AI助手:架构设计与生产部署指南