当前位置: 首页 > news >正文

CANN/pypto量化操作API

pypto.quantize

【免费下载链接】pyptoPyPTO(发音: pai p-t-o):Parallel Tensor/Tile Operation编程范式。项目地址: https://gitcode.com/cann/pypto

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

功能说明

将高精度浮点数据转换为低精度格式, 当前支持

  • 输入DT_FP32的Tensor通过对称量化转换为DT_INT8的Tensor $$ \text{dst} = round(\text{input} * \text{scale}) $$
  • 输入DT_FP32的Tensor通过非对称量化转换为DT_UINT8的Tensor $$ \text{dst} = round(\text{input} * \text{scale} + \text{zero_points}) $$

函数原型

quantize(input: Tensor, scale: Tensor, otype: DataType, axis: int, zero_points: Tensor) -> Tensor

参数说明

参数名输入/输出说明
input输入源操作数。
支持的类型为:Tensor。
Tensor支持的数据类型为:DT_FP32。
不支持空Tensor;Shape仅支持2-4维;Shape Size不大于2147483647(即INT32_MAX)。
shape记为 [..., row, col]
scale输入缩放因子。
支持的类型为:Tensor。
Tensor数据类型与input一致,支持:DT_FP32;
不支持空Tensor;
Shape比input少一维,仅支持1-3维;
Shape Size不大于2147483647(即INT32_MAX);
axis = -1 或 input.shape.size() -1 时, shape = [..., row]
axis = -2 或 input.shape.size() -2 时, shape = [..., col]
otype输入返回值的数值类型
目前支持int8 和 uint8, 分别对应对称量化和非对称量化。
axis输入指定量化压缩的轴
目前支持末尾两轴,即 -1/-2 或者input.shape.size() -1/input.shape.size()-2
zero_points输入可选的非对称量化的偏移因子
支持的类型为:Tensor。
Tensor数据类型与input一致,支持:DT_FP32;
支持空Tensor;
Shape比input少一维,仅支持1-3维;
Shape Size不大于2147483647(即INT32_MAX);
axis = -1 或 input.shape.size() -1 时, shape = [..., row]
axis = -2 或 input.shape.size() -2 时, shape = [..., col]

返回值说明

返回输出Tensor,Tensor的数据类型由otype指定,Shape与input相同。

调用示例

TileShape设置示例

说明:调用该operation接口前,应通过set_vec_tile_shapes设置TileShape。

TileShape维度应和输出一致。

示例1:输入input shape为[m, n],输出为[m, n], TileShape设置为[m1, n1], 则m1, n1分别用于切分m, n轴。

pypto.set_vec_tile_shapes(4, 16)

接口调用示例

x = pypto.tensor([3, 4], pypto.DT_FP32) scale = pypto.tensor([3], pypto.DT_FP32) zero_points = pypto.tensor([3], pypto.DT_FP32) # fp32 -> int8 对称量化 y1 = pypto.quantize(x, scale, pypto.DT_INT8, -1, None) # fp32 -> uint8 非对称量化 y2 = pypto.quantize(x, scale, pypto.DT_UINT8, -1, zero_points)

结果示例如下:

Input x:[[1.1, -2.2, 3.3, -4.4], [1.1, -2.2, 3.3, -4.4], [1.1, -2.2, 3.3, -4.4]] Input scale:[1.0, 1.0, 1.0] Input zero_points:[-5.0, -5.0, -5.0] Output y1:[[1, -2, 3, -4], [1, -2, 3, -4], [1, -2, 3, -4]] Output y2:[[6, 3, 8, 1], [6, 3, 8, 1], [6, 3, 8, 1]]

【免费下载链接】pyptoPyPTO(发音: pai p-t-o):Parallel Tensor/Tile Operation编程范式。项目地址: https://gitcode.com/cann/pypto

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/784888/

相关文章:

  • 混合现实硬件在环测试平台:自动驾驶验证新方案
  • 量子纠错技术H-VEC:原理与应用解析
  • 3步搭建终极个人游戏云端:Sunshine开源串流服务器完全指南
  • AI 时代,六年Java程序员转行做鸭
  • Agent Framework 定义流程节点以及节点的流式输出
  • 2026年GEO技术底座哪家强?T-GEO 5级标准深度拆解 - GrowthUME
  • Z-Image Turbo实战案例:营销文案配图一体化生成
  • AI驱动的网络安全渗透测试:原理、挑战与未来
  • CANN驱动AICPU信息获取
  • 强化学习与微随机化试验在移动健康干预中的融合应用
  • 边缘计算安全实战:从架构威胁到AI驱动的防护体系
  • Python项目打包实战:以MockingBird为例,详解cxfreeze的--packages参数如何解决第三方库依赖问题
  • 使用Taotoken CLI工具一键配置本地开发环境所需的所有API密钥
  • 在Node.js后端服务中集成Taotoken多模型API的步骤详解
  • 低比特量化技术:INT与FP格式性能对比与实践
  • AIGC率从94%降到7%:10款免费降ai率工具深度测评(附工具优缺点对比) - 殷念写论文
  • 2025年机器学习工作流中的7大AI代理框架解析
  • 别再花钱买设备了!旧电脑+免费iKuai系统,DIY一个家庭PPPoE服务器全记录
  • 调 Agent 的 Prompt 太痛苦了?这套“写法 + 测评”救了我
  • 《龙虾OpenClaw系列:从嵌入式裸机到芯片级系统深度实战60课》045、外设总线矩阵:AHB/APB桥接与带宽优化
  • 中国企业DevOps工具链选型新趋势:本土化与安全可控成核心竞争力
  • 2026企业 PCT 全球布局解读:专业专利代理机构甄选核心要点 - GrowthUME
  • CANN 3DGS负载均衡优化策略
  • Cloudflare 共享字典压缩:一行代码改动,不再触发全量重下载
  • 大气层系统进阶配置完全手册:从架构解析到性能调优
  • Nodejs后端服务如何稳定集成大模型并实现成本可控
  • 过渡(transition)高级:贝塞尔曲线、硬件加速
  • Java复习题
  • 技术中立原则:AI全球合规的工程解码与实践指南
  • 负责任AI实践指南:从伦理、可解释性到隐私安全的技术框架