当前位置: 首页 > news >正文

CANN/AMCT量化模型接口

quantize_model

【免费下载链接】amctAMCT是CANN提供的昇腾AI处理器亲和的模型压缩工具仓。项目地址: https://gitcode.com/cann/amct

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

功能说明

训练后量化接口,将输入的待量化的图结构按照给定的量化配置文件进行量化处理,在传入的图结构中插入权重量化、数据量化相关的算子,生成量化因子记录文件record_file,返回修改后的torch.nn.Module校准模型。

函数原型

calibration_model = quantize_model(config_file, modfied_onnx_file, record_file, model, input_data, input_names=None, output_names=None, dynamic_axes=None)

参数说明

参数名

输入/输出

说明

config_file

输入

含义:用户生成的量化配置文件,用于指定模型network中量化层的配置情况。

数据类型:string

modfied_onnx_file

输入

含义:文件名,用于存储融合后模型的onnx格式。

数据类型:string

record_file

输入

含义:量化因子记录文件路径及名称。

数据类型:string

model

输入

含义:待量化的模型,已加载权重。

数据类型:torch.nn.Module

input_data

输入

含义:模型的输入数据。一个torch.tensor会被等价为tuple(torch.tensor)。

数据类型:tuple

input_names

输入

含义:模型的输入的名称,用于modfied_onnx_file中显示。

默认值:None

数据类型:list(string)

output_names

输入

含义:模型的输出的名称,用于modfied_onnx_file中显示。

默认值:None

数据类型:list(string)

dynamic_axes

输入

含义:对模型输入输出动态轴的指定,例如对于输入inputs(NCHW),N、H、W为不确定大小,输出outputs(NL),N为不确定大小,则dynamic_axes={"inputs": [0,2,3], "outputs": [0]}。

默认值:None

数据类型:dict<string, dict<python:int, string>> or dict<string, list(int)>

返回值说明

返回修改后的torch.nn.Module校准模型。

调用示例

import amct_pytorch as amct # 建立待量化的网络图结构 model = build_model() model.load_state_dict(torch.load(state_dict_path)) input_data = tuple([torch.randn(input_shape)]) scale_offset_record_file = os.path.join(TMP, 'scale_offset_record.txt') modfied_model = os.path.join(TMP, 'modfied_model.onnx') # 插入量化API calibration_model = amct.quantize_model(config_json_file, modfied_model, scale_offset_record_file, model, input_data, input_names=['input'], output_names=['output'], dynamic_axes={'input':{0: 'batch_size'}, 'output':{0: 'batch_size'}})

【免费下载链接】amctAMCT是CANN提供的昇腾AI处理器亲和的模型压缩工具仓。项目地址: https://gitcode.com/cann/amct

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/784458/

相关文章:

  • FlowState Lab 推理性能优化教程:GPU显存与计算效率提升
  • CANN/ops-nn HardSwish算子API
  • 2026长春单招机构排行:资质与实战战绩核心盘点 - 奔跑123
  • Qt 6.10仪表盘实战:手把手教你用QML Canvas画一个会闪烁的转向箭头
  • 机器学习如何量化政党内部民主:从数据采集到情感分析的全流程实践
  • 深度解析:高性能键盘输入冲突处理工具Hitboxer的4大技术实现方案
  • nli-MiniLM2-L6-H768算法优化:经典PID控制思想在模型训练调参中的启发
  • Gemma-3-12B-IT实战体验:搭建企业内部AI助手完整指南
  • CANN/hcomm通信域管理示例
  • PMP可以个人报名吗? - 众智商学院官方
  • 2026优质水箱厂家推荐:不锈钢/玻璃钢/搪瓷/镀锌/BDF全品类材质采购指南 - 深度智识库
  • MedGemma-X应用体验:全中文交互设计,消除技术边界
  • AI编程时代的前端项目启动模板:Cursor-Starter深度解析与实践指南
  • 从德雷克方程到广播分布函数:地外文明信号探测的数学建模与聚合统计
  • 2026 云南省除四害权威榜单 五大有害生物防治机构公示 - 深度智识库
  • nli-MiniLM2-L6-H768在舆情分析中的实战:识别观点冲突与一致性
  • 蒙城悦洁家政服务经营部:安徽防水补漏推荐哪家 - LYL仔仔
  • CANN/opbase aclnn张量初始化接口
  • 策略模式:灵活切换算法的设计艺术,基于华为openEuler部署Dillinger个人文本编辑器。
  • AI赋能胶囊内镜:用轻量多帧模型与元学习破解医疗影像五大挑战
  • AI教育评估的三大伦理挑战:自动化偏见、公平性与环境责任
  • 美欧AI治理法案对比:从核心理念到企业合规实操全解析
  • 跨平台流媒体下载神器N_m3u8DL-RE:解密、多线程、格式转换一站式解决方案
  • 图神经网络与强化学习融合:复杂网络智能决策实战指南
  • 2026届论文严审元年,我扒了8款AI毕业论文工具,这款直接治好了我的精神内耗 - 逢君学术-AI论文写作
  • RPGMakerMZ 物品 经验丹 增加经验物品 如何制作
  • 压延铜箔供应商“靠谱”怎么量化?从材质证明到全检报告,索要这些文件 - 品牌排行榜
  • 2026年5月宁波贵金属黄金回收 专业靠谱门店top5 - 生活测评君
  • 基于verl框架和代码沙盒环境工具调用的代码强化学习实践
  • 买给父母按摩椅怎么选 看这篇就够了! - 速递信息