当前位置: 首页 > news >正文

CANN/pyasc向量最小值函数

asc.language.basic.mins

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

asc.language.basic.mins(dst: LocalTensor, src: LocalTensor, scalar: int | float, count: int, is_set_mask: bool = True) → None

asc.language.basic.mins(dst: LocalTensor, src: LocalTensor, scalar: int | float, mask: int, repeat_times: int, repeat_params: UnaryRepeatParams, is_set_mask: bool = True) → None

asc.language.basic.mins(dst: LocalTensor, src: LocalTensor, scalar: int | float, mask: List[int], repeat_times: int, repeat_params: UnaryRepeatParams, is_set_mask: bool = True) → None

源操作数矢量内每个元素与标量相比,如果比标量大,则取标量值,比标量的值小,则取源操作数。

对应的Ascend C函数原型

template <typename T, bool isSetMask = true> __aicore__ inline void Mins(const LocalTensor<T>& dstLocal, const LocalTensor<T>& srcLocal, const T& scalarValue, const int32_t& calCount)
template <typename T, bool isSetMask = true> __aicore__ inline void Mins(const LocalTensor<T>& dstLocal, const LocalTensor<T>& srcLocal, const T& scalarValue, uint64_t mask[], const uint8_t repeatTimes, const UnaryRepeatParams& repeatParams)
template <typename T, bool isSetMask = true> __aicore__ inline void Mins(const LocalTensor<T>& dstLocal, const LocalTensor<T>& srcLocal, const T& scalarValue, uint64_t mask, const uint8_t repeatTimes, const UnaryRepeatParams& repeatParams)

参数说明

  • is_set_mask:是否在接口内部设置mask模式和mask值。
  • dst:目的操作数。类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。
  • src:源操作数。类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。
  • scalar:源操作数,数据类型需要与目的操作数中的元素类型保持一致。
  • count:参与计算的元素个数。
  • mask:用于控制每次迭代内参与计算的元素。
  • repeat_times:重复迭代次数。
  • params:元素操作控制结构信息。

约束说明

  • 操作数地址对齐要求请参见 《Ascend C算子开发接口》 中的“通用说明和约束-通用地址对齐约束”。
  • 操作数地址重叠约束请参考 《Ascend C算子开发接口》 中的“通用说明和约束-通用地址重叠约束”。

调用示例

  • tensor高维切分计算样例-mask连续模式
    mask = 128 scalar = 2 # repeat_times = 4,一次迭代计算128个数,共计算512个数 # dst_blk_stride, src_blk_stride = 1,单次迭代内数据连续读取和写入 # dst_rep_stride, src_rep_stride = 8,相邻迭代间数据连续读取和写入 params = asc.UnaryRepeatParams(1, 1, 8, 8) asc.mins(dst, src, scalar, mask=mask, repeat_times=4, repeat_params=params)
  • tensor高维切分计算样例-mask逐bit模式
    mask = [uint64_max, uint64_max] scalar = 2 # repeat_times = 4,一次迭代计算128个数,共计算512个数 # dst_blk_stride, src_blk_stride = 1,单次迭代内数据连续读取和写入 # dst_rep_stride, src_rep_stride = 8,相邻迭代间数据连续读取和写入 params = asc.UnaryRepeatParams(1, 1, 8, 8) asc.mins(dst, src, scalar, mask=mask, repeat_times=4, repeat_params=params)
  • tensor前n个数据计算样例
    asc.mins(dst, src, scalar, count=512)

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/783527/

相关文章:

  • AI Agent团队技能包:集成OpenClaw、Claude Code与tmux实现自动化开发
  • 一文吃透HDLC协议|从帧结构到封装解封装
  • AI控制框架KendaliAI:从模型调用到智能体编排的工程化实践
  • AI时代高等教育重塑:教学反馈、学术诚信与未来技能挑战
  • GitHub Models实战指南:6个本地可运行的AI模型部署案例
  • 2026贵阳新房高端定制装修:5大实力品牌横评与透明报价对标 - 优质企业观察收录
  • 潮玩资产化新纪元!盲盒V6MAX源码系统小程序,国际版盲盒源码赋能盲盒定制开发,颠覆海外盲盒app源码程序与盲盒源码 - 壹软科技
  • CANN/pypto填充操作API文档
  • 2026汽车划痕补漆品牌对比评测与推荐:哪个更靠谱? - 阿喂嘞lvv
  • VLA-0视觉语言动作模型:零修改部署与多模态AI实践
  • 【Kubernetes】Ubuntu 24.04 二进制方式部署 K8s
  • 2026年贵阳新房装修全屋整装深度横评:设计落地率、质保周期、性价比对比 - 优质企业观察收录
  • 2026年贵阳室内装修全案设计深度横评:从设计落地难到一站式全案交付的品质突围指南 - 优质企业观察收录
  • CANN/ops-cv图像处理算子库
  • 品牌测评:自动体外除颤仪厂家竞争力白皮书 - 品牌推荐大师1
  • Parquet文件原理与实战:列式存储如何提升查询性能和压缩效率
  • 研发冻干机控温精度与真空稳定性横向测评:五大国产品牌 vs 进口主流型号 - 品牌推荐大师1
  • 生成式AI驱动模拟电路设计:CktGen框架原理与实践指南
  • CANN/pyasc取小数计算函数
  • 为开源项目OpenClaw配置Taotoken以实现更灵活的Agent工作流
  • 合成数据验证特征缩放必要性的白盒实验方法
  • 基于YOLOv5与LSTM的智能交通信号控制系统实战
  • 东莞市全区域上门回收黄金 正规资质商家一站式服务 - 金掌柜黄金回收
  • SQL PIVOT原理与实战:从行转列到高性能宽表生成
  • 2026年山东沥青加温设备与道路养护设备源头厂家深度选购指南 - 企业名录优选推荐
  • 20251209樊沛东python程序设计实验三报告
  • CANN/cannbot-skills a2设备约束
  • CANN运行时任务更新指南
  • Llama 3.2 Vision轻量微调实战:500图打造电商级图文生成模型
  • CANN/HCOMM线程通知等待函数