当前位置: 首页 > news >正文

CANN/pyasc向量乘法API文档

asc.language.basic.mul

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

asc.language.basic.mul(dst: LocalTensor, src0: LocalTensor, src1: LocalTensor, count: int, is_set_mask: bool = True) → None

asc.language.basic.mul(dst: LocalTensor, src0: LocalTensor, src1: LocalTensor, mask: int, repeat_times: int, repeat_params: BinaryRepeatParams, is_set_mask: bool = True) → None

asc.language.basic.mul(dst: LocalTensor, src0: LocalTensor, src1: LocalTensor, mask: List[int], repeat_times: int, repeat_params: BinaryRepeatParams, is_set_mask: bool = True) → None

按元素求积。

对应的Ascend C函数原型

template <typename T> __aicore__ inline void Mul(const LocalTensor<T>& dst, const LocalTensor<T>& src0, const LocalTensor<T>& src1, const int32_t& count);
template <typename T, bool isSetMask = true> __aicore__ inline void Mul(const LocalTensor<T>& dst, const LocalTensor<T>& src0, const LocalTensor<T>& src1, uint64_t mask[], const uint8_t repeatTimes, const BinaryRepeatParams& repeatParams);
template <typename T, bool isSetMask = true> __aicore__ inline void Mul(const LocalTensor<T>& dst, const LocalTensor<T>& src0, const LocalTensor<T>& src1, uint64_t mask, const uint8_t repeatTimes, const BinaryRepeatParams& repeatParams);

参数说明

  • dst:目的操作数。类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。
  • src0, src1:源操作数。类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。
  • count:参与计算的元素个数。
  • mask:用于控制每次迭代内参与计算的元素。
  • repeat_times:重复迭代次数。
  • params:控制操作数地址步长的参数。
  • is_set_mask: 是否在接口内部设置mask。

约束说明

  • 操作数地址对齐要求请参见 《Ascend C算子开发接口》 中的“通用说明和约束-通用地址对齐约束”。
  • 操作数地址重叠约束请参考 《Ascend C算子开发接口》 中的“通用说明和约束-通用地址重叠约束”。
  • 使用整个tensor参与计算接口符号重载时,运算量为目的LocalTensor的总长度。

调用示例

  • tensor高维切分计算样例-mask连续模式
    mask = 128 # repeat_times = 4,一次迭代计算128个数,共计算512个数 # dst_blk_stride, src0_blk_stride, src1_blk_stride = 1,单次迭代内数据连续读取和写入 # dst_rep_stride, src0_rep_stride, src1_rep_stride = 8,相邻迭代间数据连续读取和写入 params = asc.BinaryRepeatParams(1, 1, 1, 8, 8, 8) asc.mul(dst, src0, src1, mask=mask, repeat_times=4, repeat_params=params)
  • tensor高维切分计算样例-mask逐bit模式
    mask = [uint64_max, uint64_max] # repeat_times = 4,一次迭代计算128个数,共计算512个数 # dst_blk_stride, src0_blk_stride, src1_blk_stride = 1,单次迭代内数据连续读取和写入 # dst_rep_stride, src0_rep_stride, src1_rep_stride = 8,相邻迭代间数据连续读取和写入 params = asc.BinaryRepeatParams(1, 1, 1, 8, 8, 8) asc.mul(dst, src0, src1, mask=mask, repeat_times=4, repeat_params=params)
  • tensor前n个数据计算样例
    asc.mul(dst, src0, src1, count=512)

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/784425/

相关文章:

  • ChatGPT Gnome桌面扩展:Linux工作流中的AI助手深度集成指南
  • AI与金融稳定:博弈论视角下的风险机制与监管应对
  • 模型接力推理:用分布式调度解决本地大模型部署的算力瓶颈
  • 基于Next.js与多AI提供商构建多智能体对话系统:从架构到部署
  • 动画制作避坑指南!2026动画制作服务机构推荐排行 全流程定制/高效交付/版权无忧 - 极欧测评
  • 对比自行维护与使用Taotoken在API密钥管理与审计上的差异
  • 基于LangChain4j与Android无障碍服务构建手机AI操作智能体
  • 知识图谱与多跳检索在智能问答中的融合应用
  • AI与后量子时代:下一代网络DoS威胁的智能协同防御体系构建
  • 长春全日制单招培训机构排行 核心资质与战绩实测盘点 - 奔跑123
  • 独居生活第三年,说说感受
  • #2026最新一体化净水处理设备公司推荐!国内优质权威榜单发布,陕西西安甘肃兰州等地公司值得信赖 - 十大品牌榜
  • 收藏!小白程序员也能入局:AI大模型应用开发工程师高薪转型指南
  • Samantha与Mistral 7B:高效对话AI的实践指南
  • EGAgent:多模态长视频实体图搜索技术解析
  • 2026年贵阳防雷工程与防雷装置检测:甲级资质机构深度对比与精准选购指南 - 年度推荐企业名录
  • 别再只测THD了!音频功放测试中,工程师最容易忽略的3个关键点(附实测数据)
  • 基于原始数据包的深度学习入侵检测:FCNN、CNN与CNN-LSTM模型实战对比
  • 安徽2026年优质氧化锆氧量分析仪推荐:安徽宸宁电气有限公司 - 安互工业信息
  • 郑州双眼皮十大医生都有谁 - 速递信息
  • 常用网址(更新中)
  • 如何用Sunshine打破游戏硬件限制?终极跨平台串流方案详解
  • 镜像视界(浙江)科技·危化园区视频孪生全套文案
  • AI驱动语言地图:用GPT-4与数据分析AI构建团队知识图谱
  • 2026年贵阳防雷检测与防雷工程:甲级资质权威机构深度横评及官方直达 - 年度推荐企业名录
  • 建筑工程保温材料选型难?四川7家靠谱供应商帮你快速匹配 - 深度智识库
  • 5分钟解锁QQ音乐加密格式:qmc-decoder终极指南
  • 基于大语言模型的AI论文审阅助手ChatReviewer:从部署到调优全指南
  • AssetStudio终极指南:3步掌握Unity资源提取与转换技巧
  • CANN/runtime内存管理示例