当前位置: 首页 > news >正文

CANN/asc-devkit伪量化API文档

SetAntiQuantScalar

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品

是否支持

Ascend 950PR/Ascend 950DT

x

Atlas A3 训练系列产品 / Atlas A3 推理系列产品

x

Atlas A2 训练系列产品 / Atlas A2 推理系列产品

x

Kirin X90

x

Kirin 9030

x

功能说明

在Matmul计算时支持A矩阵half类型输入,B矩阵int8类型输入,该场景下,需要调用伪量化接口进行伪量化。调用伪量化接口后,将数据从GM搬出到L1时,会执行伪量化操作,将B矩阵转化为half类型。本节的伪量化接口提供对B矩阵的所有数据采用同一量化系数进行伪量化的功能。

请在Iterate或者IterateAll之前调用该接口。

函数原型

__aicore__ inline void SetAntiQuantScalar(const SrcT offsetScalar, const SrcT scaleScalar)

参数说明

参数名

输入/输出

描述

offsetScalar

输入

伪量化系数,用于加法。SrcT为A_TYPE中对应的数据类型。

scaleScalar

输入

伪量化系数,用于乘法。SrcT为A_TYPE中对应的数据类型。

返回值说明

约束说明

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/793417/

相关文章:

  • YOLO26缝合Polarized Self-Attention:极化自注意力在高分辨率图像的降维打击
  • ROS学习(二)
  • 基于现代霍普菲尔德网络的AI智能体记忆方案:高速、免费、确定性的联想记忆系统
  • Protobuf笔记
  • ChameleonUltra高级应用:硬嵌套攻击与实时卡数据捕获技术
  • ARMv9 TRBMPAM_EL1寄存器配置与性能监控实战
  • AArch64外部调试架构与Debug State机制详解
  • 开源材料计算自动化平台OpenClaw:从高通量筛选到机器学习集成
  • 终极鼠标性能测试指南:5分钟快速诊断你的鼠标问题
  • DLSS Swapper终极指南:免费提升游戏性能的3个简单步骤
  • CANN/ops-math DropOutV3算子
  • BV 开发者指南:Jetpack Compose 在TV应用中的最佳实践
  • CANN/ops-nn动态量化RMS归一化融合算子
  • CANN/ops-nn AdvanceStep算子
  • CANN/GE模型内存查询接口
  • 耗时3个月整理!K12少儿编程全套学习课件,老师/家长直接用
  • ARMv9 TRBSR寄存器解析与调试实践
  • ARM TLB管理:原理、指令与优化实践
  • 本地化AI代码助手Copaw:设计原理与工程实践指南
  • ContextPilot:优化KV缓存复用,加速RAG与长上下文推理
  • Arm CoreSight SoC-400调试架构与寄存器编程详解
  • 基于Docker容器化部署Atlassian Confluence的完整实践指南
  • 基于Gradio与多模型代理的AI模拟面试系统实战部署指南
  • 安全代码执行沙盒实践:基于Docker与Seccomp的隔离方案
  • 基于MCP协议构建代码库AI助手:原理、部署与最佳实践
  • AI研发团队“隐性崩溃”前的9个信号:SITS2026追踪18个月的142起项目衰变案例全复盘
  • ARM9EJ-S处理器JTAG调试架构与实战技巧
  • Git Magic多人协作:10个高效管理团队项目的终极技巧 [特殊字符]
  • 告别网盘限速!八大平台直链下载助手LinkSwift完整使用指南
  • 多智能体协同框架:从原理到实践,探索AI驱动的自动化开发新范式