当前位置: 首页 > news >正文

CANN/Ascend C量化模式设置API

SetDequantType

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

功能说明

该接口用于设置量化或反量化的模式。

Matmul反量化场景:在Matmul计算时,左、右矩阵的输入为int8_t或int4b_t类型,输出为half类型;或者左、右矩阵的输入为int8_t类型,输出为int8_t类型。该场景下,输出C矩阵的数据从CO1搬出到Global Memory时,会执行反量化操作,将最终结果反量化为对应的half或int8_t类型。

Matmul量化场景:在Matmul计算时,左、右矩阵的输入为half或bfloat16_t类型,输出为int8_t类型。该场景下,输出C矩阵的数据从CO1搬出到Global Memory时,会执行量化操作,将最终结果量化为int8_t类型。

量化或反量化时有两种模式:一种是同一系数的量化/反量化模式,一种是向量的量化/反量化模式。

  • 同一系数的量化或反量化模式:对输出矩阵的所有值采用同一系数进行量化或反量化。
  • 向量的量化或反量化模式:提供一个参数向量,对输出矩阵的每一列都采用该向量中对应列的系数进行量化或反量化。

函数原型

int32_t SetDequantType(DequantType dequantType)

参数说明

表 1参数说明

参数名

输入/输出

描述

dequantType

输入

设置量化或反量化时的模式。DequantType类型,该类型的定义如下。

enum class DequantType { SCALAR = 0, TENSOR = 1, };

参数的取值及含义如下:

  • SCALAR:表示同一系数的量化或反量化模式。
  • TENSOR:表示向量的量化或反量化模式。

返回值说明

-1表示设置失败;0表示设置成功。

约束说明

本接口支持的同一系数的量化/反量化模式、向量的量化/反量化模式分别与Kernel侧接口SetQuantScalar和SetQuantVector对应,本接口设置的量化/反量化模式必须与Kernel侧使用的接口保持一致。

调用示例

auto ascendcPlatform = platform_ascendc::PlatformAscendC(context->GetPlatformInfo()); matmul_tiling::MatmulApiTiling tiling(ascendcPlatform); tiling.SetAType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_INT8); tiling.SetBType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_INT8); tiling.SetCType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_INT32); tiling.SetBiasType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_INT32); tiling.SetShape(M, N, K); tiling.SetOrgShape(M, N, K); tiling.EnableBias(true); tiling.SetDequantType(DequantType::SCALAR); // 设置同一系数的量化/反量化模式 // tiling.SetDequantType(DequantType::TENSOR); // 设置向量的量化/反量化模式 tiling.SetBufferSpace(-1, -1, -1); optiling::TCubeTiling tilingData; int ret = tiling.GetTiling(tilingData);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/794410/

相关文章:

  • Linux_24:RV1126的VI模块讲解
  • 揭秘PlayIntegrityFix核心原理:系统属性欺骗与KeyStore注入技术
  • CANN/ops-math平方差算子
  • 在「唯」与「阿」之间安放计算之道,老子这句话给 SAP HANA 开发的一层提醒
  • CANN/Ascend C Mull乘法API
  • 【AI原生产品规划终极指南】:2026奇点大会PM必修的7大认知跃迁与3个落地陷阱规避法
  • CANN/Ascend C SetDilation API文档
  • 如何每天节省25分钟:淘宝淘金币自动化脚本的终极指南
  • CANN/ops-nn自适应平均池化3D反向计算
  • 如何设计有效的评估提示:HuggingFace evaluation-guidebook提示工程指南
  • CANN/ops-nn AddRmsNormDynamicQuant算子
  • 市面上比较好的水质稳定剂厂家哪家好2026年参考 - 品牌排行榜
  • 从脚本运维到AI自治运维,全链路可观测性重构,SITS 2026标准下9类典型故障自动根因定位率突破91.7%
  • 6G AI原生RAN的算力挑战与TensorPool架构解析
  • 终极指南:使用TCC-G15开源温度控制软件彻底解决Dell G15笔记本散热问题
  • 术语俗话 --- 什么是同步和异步
  • 【信息科学与工程学】计算机科学与自动化 第一百三十篇 GPU芯片设计核心框架与公式03
  • 3分钟掌握百度网盘提取码智能获取技巧:baidupankey工具全解析
  • 情绪总在“亢奋”与“绝望”间横跳?在青岛,如何找对心灵的“避风港”? - 品牌排行榜
  • 如何免费解密网易云音乐NCM文件:终极指南释放你的音乐自由
  • 华为CANN异或求和算子
  • 2026年浙江PH调节剂厂家有哪些?行业相关企业梳理 - 品牌排行榜
  • 【信息科学与工程学】【物理/化学科学和工程技术】知识体系04 缺陷化学 第二部分 总纲
  • 手机号定位神器:3秒查询陌生来电归属地,地图精准定位位置
  • Notify.js性能优化指南:提升通知系统的响应速度
  • 从格罗滕迪克到罗巴切夫斯基:逆境中的创造与几何的突破 —— 数学思想如何在质疑中前行
  • XUnity.AutoTranslator完整指南:让Unity游戏告别语言障碍的终极解决方案
  • 2026浙江PH调节剂厂家推荐榜 - 品牌排行榜
  • 【信息科学与工程学】【人工智能】【数字孪生】【游戏科学】主要数学模型-第八篇 计算血液学
  • CANN/asc-devkit make_int2向量构造函数