当前位置: 首页 > news >正文

CANN/asc-devkit asc_mull向量乘法API

asc_mull

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT

功能说明

根据mask对输入数据src0、src1按元素相乘,将结果写入dst0,溢出部分写入dst1。

函数原型

__simd_callee__ inline void asc_mull(vector_int32_t& dst0, vector_int32_t& dst1, vector_int32_t src0, vector_int32_t src1, vector_bool mask) __simd_callee__ inline void asc_mull(vector_uint32_t& dst0, vector_uint32_t& dst1, vector_uint32_t src0, vector_uint32_t src1, vector_bool mask)

参数说明

参数名输入/输出描述
dst0输出目的操作数(矢量数据寄存器)。
dst1输出目的操作数(矢量数据寄存器)。
src0输入源操作数(矢量数据寄存器)。
src1输入源操作数(矢量数据寄存器)。
mask输入源操作数掩码(掩码寄存器),用于指示在计算过程中哪些元素参与计算。对应位置为1时参与计算,为0时不参与计算。mask未筛选的元素在输出中置零。

矢量数据寄存器和掩码寄存器的详细说明请参见reg数据类型定义.md。

返回值说明

流水类型

PIPE_V

约束说明

调用示例

vector_int32_t dst0; vector_int32_t dst1; vector_int32_t src0; vector_int32_t src1; vector_bool mask = asc_create_mask_b32(PAT_ALL); asc_loadalign(src0, src0_addr); // src0_addr是外部输入的UB内存空间地址。 asc_loadalign(src1, src1_addr); // src1_addr是外部输入的UB内存空间地址。 asc_mull(dst0, dst1, src0, src1, mask);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/1042800/

相关文章:

  • 福州二奢圈的 首饰美容院,专业到离谱 - 薛定谔的梨花猫
  • 如何微调GuangxiAICC/swinv2-tiny-patch4-window16-256:自定义数据集训练完整指南
  • 2026 Google广告 vs Meta广告:出海广告投放策略有何区别?
  • 大连线下首饰回收门店测评,连锁品牌优势盘点 - 讯息早知道
  • 架构解析:CoAtNet如何通过MBConv与相对自注意力实现CNN与Transformer的协同增效
  • 哈尔滨合扬专注黄金回收多年,规范鉴定流程,给每一件金饰对等价值 - 奢侈品交易观察员
  • ShardingSphere性能深度剖析:Sharding-JDBC、Sharding-Proxy与MySQL在混合负载下的表现对比
  • 基于IGH Ethercat主站的CSP模式电机卡顿:从时序失步到速度前馈突变的深度解析
  • 老板娘学财税,找纯培训机构还是找懂实战的财税公司更好?| 五维对比 - 欢欢在创业
  • CANN/Ascend C浮点转BF16函数
  • 1-1 Coursera吴恩达《神经网络与深度学习》第一周学习精要:从房价预测看AI核心
  • 从零开始:高效抖音无水印下载工具的完整实战指南
  • 西安高端奢侈品回收门店实测:7家正规商户10项合规测评,闲置奢品高效变现攻略 - 薛定谔的梨花猫
  • 天农凤中皇常见问题解答(2026专家版) - 速递信息
  • 2026万国手表回收避雷手册,助力上海表主避开回收行业各类常见猫腻 - 奢品小当家
  • 广州花都老板娘想找人教自己管账,找哪家财税公司靠谱?| 4招判断教学型财税公司 - 欢欢在创业
  • 村长团队GTA5用Blender+Sollumz 开发制作可驾驶+可飞行+轮子自动伸缩的载具改装教程
  • ComfyUI-MultiGPU终极指南:一键释放GPU显存,多GPU智能分配技术详解
  • FPGA_Webserver ARP协议实现:千兆速度下的地址解析协议硬件加速
  • S12Z微控制器内存映射与中断控制:嵌入式系统稳定性的核心机制
  • 重庆名表回收实测测评:7家主城门店横向对比,本地卖表怎么选不踩坑 - 沉迷学习28
  • 2026推荐:生石灰/耐火材料氧化钙(CaO)含量、活性度检测分析 - 公共场所卫生检测
  • 2026 广州奢侈品黄金回收门店分布核心洞察:耀辉全域布局与行业标杆实力 - 奢侈品回收
  • MMC2001 EIM配置详解:时序、总线与嵌入式系统稳定运行
  • 2026 宁波名表回收品牌榜,5 家横向测评 - 讯息早知道
  • 老板娘财税培训,标准化课程和按自己企业定制,哪种更值?| 4个维度客观对比 - 欢欢在创业
  • 重庆同城邮寄黄金回收,奢二网全程保价到货即刻核验 - 讯息早知道
  • BepInEx IL2CPP启动失败:3步终极解决方案与深度技术解析
  • 5分钟掌握JavaScript DXF生成:浏览器中创建CAD图纸的终极方案
  • ComfyUI TTP Toolset:专业级图像分块处理与超分辨率技术完整指南