当前位置: 首页 > news >正文

CANN/ops-math掩码缩放算子

MaskedScale

【免费下载链接】ops-math本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-math

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品×
Atlas 200I/500 A2 推理产品×
Atlas 推理系列产品×
Atlas 训练系列产品×

功能说明

  • 算子功能:完成elementwise计算

  • 计算公式

    $$ out = self \times mask \times scale $$

调用说明

当前算子作为自定义算子通过图模式下发执行,aclnnMaskedScale两段式接口仅供内部使用,不对外暴露。

算子输入输出

  • 参数说明:

    • self(计算输入):公式中的输入self,Device侧Tensor。

      • Ascend 950PR/Ascend 950DT :数据类型支持FLOAT16、BFLOAT16、FLOAT,数据格式支持ND。
      • Atlas A3 训练系列产品/Atlas A3 推理系列产品 :数据类型支持FLOAT16、BFLOAT16、FLOAT,数据格式支持ND。
    • mask(计算输入):公式中的mask,Device侧Tensor,shape需要与self一致。

      • Ascend 950PR/Ascend 950DT :数据类型支持UINT8、INT8、FLOAT16、FLOAT,数据格式支持ND。
      • Atlas A3 训练系列产品/Atlas A3 推理系列产品 :数据类型支持UINT8、INT8、FLOAT16、FLOAT,数据格式支持ND。
    • scale(float, 计算输入):标量缩放系数,数据类型支持FLOAT(非Tensor)。

    • y(计算输出):公式中的out,Device侧Tensor,数据类型和shape需要与self一致。

      • Ascend 950PR/Ascend 950DT :数据类型支持FLOAT16、BFLOAT16、FLOAT,数据格式支持ND。
      • Atlas A3 训练系列产品/Atlas A3 推理系列产品 :数据类型支持FLOAT16、BFLOAT16、FLOAT,数据格式支持ND。

约束说明

  • 确定性计算:
    • MaskedScale默认确定性实现。
  • shape约束:
    • self、mask和y的shape需要一致。
    • 当前实现的元素总数不能超过uint32_t可表示范围。
    • 输入/属性命名采用selfmaskscaley,与内部 aclnn 接口保持一致。
    • FLOAT16 路径中scale按 half 标量参与向量乘,存在标量精度截断;FLOAT/BFLOAT16 路径按 float 标量计算。

【免费下载链接】ops-math本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-math

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/1129838/

相关文章:

  • 天赐范式第94天:从断裂到新技术的“内燃机“——TDP-CP与DRR-R方法论边界规范
  • 换手机数据迁移太麻烦?这款iPhone、安卓和平板电脑互传工具,一键搞定不丢数据!
  • Halcon函数封装实战:从工业视觉流程到可复用算子库
  • Subliminal:终极iOS集成测试框架完整指南
  • JMeter阶梯线程组实战:精准模拟真实业务负载模型
  • Twitter API Client认证详解:OAuth 1.0与OAuth 2.0完整实现指南
  • 从入门到精通:vb-android-app-quality项目的多渠道构建与测试策略
  • RESPX安全测试:使用模拟库进行API安全测试的实践方法
  • Opslane最佳实践:10个技巧提升AI并行开发效率
  • 如何快速上手Subliminal:10分钟搭建iOS自动化测试环境
  • Riffusion音乐API对接实战:低成本高效生成AI音乐
  • CANN CLI前端评审决策
  • CANN/asc-devkit SIMD uint16转uint32函数
  • CANN/cann-recipes-infer:Qwen3-MoE优化
  • Vue-Croppa跨浏览器兼容性:确保在所有设备上正常工作
  • pysimdjson实战:大数据JSON处理的5个技巧
  • CSM社区精选:玩家分享的最佳多人城市建设案例
  • R语言array详解:多维数据结构与向量化运算基础
  • 终极WebPShop指南:如何在Photoshop中实现专业级WebP图像压缩与动画制作
  • Weather Extension for Andromeda
  • CANN社区任务-SpSM算子开发
  • 5 分钟上手 Swift Protobuf:最新官方仓库使用教程
  • 数据可视化终极指南:Tableau与Power BI的全面对比与实战应用
  • activerecord-multi-tenant 性能优化:10 个提升多租户查询效率的终极技巧 [特殊字符]
  • Axure中文界面终极指南:3分钟完成完整汉化安装
  • Perlite Mermaid集成教程:创建交互式图表与流程图
  • DeepTraffic部署指南:在Linux系统中高效运行深度学习流量分类模型
  • AcDisplay项目架构解析:模块化设计与组件通信机制
  • 从R到Julia:SageMaker Studio Lab多语言环境配置指南
  • PIC18F86K22与SLO2016协议在嵌入式通信中的应用