当前位置: 首页 > news >正文

AMCT蒸馏配置文件说明

蒸馏简易配置文件

【免费下载链接】amctAMCT是CANN提供的昇腾AI处理器亲和的模型压缩工具仓。项目地址: https://gitcode.com/cann/amct

distill_config_pytorch.proto文件参数说明如表1所示,该文件所在目录为:AMCT安装目录/amct_pytorch/proto/distill_config_pytorch.proto。

表 1distill_config_pytorch.proto参数说明

消息

是否必填

类型

字段

说明

AMCTDistillConfig

-

-

-

AMCT蒸馏的简易配置。

optional

uint32

batch_num

蒸馏batch数量,用于ifmr积累数据计算量化因子。

optional

uint32

group_size

蒸馏block中最小蒸馏单元个数。

optional

bool

data_dump

teacher网络block输入输出dump开关。

repeated

DistillGroup

distill_group

用户自定义蒸馏结构。

optional

DistillDataQuantConfig

distill_data_quant_config

蒸馏数据量化配置参数。

optional

DistillWeightQuantConfig

distill_weight_quant_config

蒸馏权重量化配置参数。

repeated

DistillOverrideLayer

distill_override_layers

重写某一层的量化配置。

repeated

DistillOverrideLayerType

distill_override_layer_types

重写某一类型层的量化配置。

repeated

string

quant_skip_layers

不需要量化的层,仍然做蒸馏。

repeated

string

quant_skip_layer_types

不需要量化的算子类型,仍然需要做蒸馏。

DistillGroup

-

-

-

用户自定义蒸馏结构。蒸馏结构中仅支持torch.nn.Module类型的算子。

required

string

start_layer_name

用户自定义蒸馏结构起始层。

required

string

end_layer_name

用户自定义蒸馏结构结束层。

DistillDataQuantConfig

-

-

-

蒸馏数据量化配置。

-

ActULQquantize

ulq_quantize

数据量化的算法,目前仅支持ulq。

ActULQquantize

-

-

-

ULQ数据量化算法配置。算法介绍请参见ULQ数据量化算法。

optional

ClipMaxMin

clip_max_min

初始化的上下限值,如果不配置,默认用ifmr进行初始化。

optional

bool

fixed_min

是否下限不学习且固定为0。默认ReLu后为true,其他为false。

optional

DataType

dst_type

用以选择INT8或INT4量化位宽,默认为INT8。当前版本仅支持INT8量化。

ClipMaxMin

-

-

-

初始上下限。

required

float

clip_max

初始上限值。

required

float

clip_min

初始下限值。

DistillWeightQuantConfig

-

-

-

蒸馏权重量化配置。

-

ARQDistill

arq_distill

ARQ权重量化算法。

-

WtsULQDistill

ulq_distill

ULQ权重量化算法。

ARQDistill

-

-

-

ARQ权重量化算法配置。算法介绍请参见ARQ权重量化算法。

optional

DataType

dst_type

用以选择INT8或INT4量化位宽,默认为INT8。当前版本仅支持INT8量化。

optional

bool

channel_wise

是否做channel wise的arq。

WtsULQDistill

-

-

-

ULQ权重量化算法配置。算法介绍请参见ULQ数据量化算法。

optional

DataType

dst_type

用以选择INT8或INT4量化位宽,默认为INT8。当前版本仅支持INT8量化。

optional

bool

channel_wise

是否做channel wise的ulq。

DistillOverrideLayer

-

-

-

重写的层配置。

required

string

layer_name

层名。

optional

DistillDataQuantConfig

distill_data_quant_config

重写的数据层量化参数。

optional

DistillWeightQuantConfig

distill_weight_quant_config

重写的权重层量化参数。

DistillOverrideLayerType

-

-

-

重写的层类型配置。

required

string

layer_type

层类型。

optional

DistillDataQuantConfig

distill_data_quant_config

重写的数据层量化参数。

optional

DistillWeightQuantConfig

distill_weight_quant_config

重写的权重层量化参数。

基于该文件构造的蒸馏简易配置文件quant.cfg样例如下所示:

batch_num: 1 group_size: 1 data_dump: true distill_group: { start_layer_name: "layer1" end_layer_name: "layer2" } distill_data_quant_config: { ulq_quantize: { clip_max_min: { clip_max: 6.0 clip_min: -6.0 } fixed_min: true dst_type: INT8 } } distill_weight_quant_config: { arq_distill: { channel_wise: true dst_type: INT8 } } quant_skip_layers: "layer3" quant_skip_layer_types: "type1" distill_override_layers : { layer_name: "layer4" distill_data_quant_config: { ulq_quantize: { clip_max_min: { clip_max: 3.0 clip_min: -3.0 } fixed_min: true dst_type: INT8 } } distill_weight_quant_config: { arq_distill: { channel_wise: false dst_type: INT8 } } } distill_override_layer_types : { layer_type: "type2" distill_data_quant_config: { ulq_quantize: { clip_max_min: { clip_max: 3.0 clip_min: -3.0 } fixed_min: true dst_type: INT8 } } distill_weight_quant_config: { ulq_distill: { channel_wise: false dst_type: INT8 } } }

【免费下载链接】amctAMCT是CANN提供的昇腾AI处理器亲和的模型压缩工具仓。项目地址: https://gitcode.com/cann/amct

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/955899/

相关文章:

  • Trelby实战指南:专业开源剧本写作工具的高效配置方法
  • Dism++:3分钟掌握Windows系统维护的终极免费解决方案
  • 5步快速上手:Blender四边形重拓扑终极指南
  • MATLAB喷泉码通信仿真:多径衰落信道下的LT编码、BPSK传输与BP译码全流程实现
  • 2026年抚州黄金回收白银回收铂金回收变卖,5 家靠谱贵金属门店实地测评汇总 - 中业金奢再生回收中心
  • videomae-large-finetuned-kinetics高级技巧:自定义视频分类任务的迁移学习终极指南
  • STC89C51驱动四相步进电机正反转的Keil5工程(含完整源码与可烧录hex)
  • 3分钟掌握XPath定位神器:xpath-helper-plus完整使用教程
  • TuxGuitar完整指南:开源吉他谱编辑器的7大核心功能详解 [特殊字符]
  • 16.滑动窗口经典例题:最小覆盖子串(LeetCode 76)算法原理剖析
  • 3大核心场景+5个实战技巧:Tinke深度解析NDS游戏资源解包与修改的终极方案
  • Python简历智能匹配工具包:知识图谱建模+DNN打分,含Django后台、训练模型与一键部署说明
  • 5分钟免费汉化Axure RP:中文界面快速切换完整指南
  • qt开发新手福音:用快马ai生成带讲解注释的第一个gui程序
  • 5分钟快速上手:FF14国际服终极中文补丁完全指南
  • XMCVE-钓鱼邮件
  • 如何在Windows上快速使用WinCDEmu:新手完整指南
  • 2026济南黄金回收门店实拍:从进门到收款,5家店服务全记录 - 商业快讯早知道
  • VCC、VDD、VSS:从历史起源到PCB实战的电源网络设计指南
  • 抖音下载器终极指南:快速批量获取无水印视频的完整解决方案
  • 分块切断语义?哈佛InSemRAG解决了,速度快4倍
  • 2026年邯郸黄金回收白银回收铂金回收变卖,5 家靠谱贵金属门店实地测评汇总 - 中业金奢再生回收中心
  • STM32串口字符画:从图像处理到终端显示的嵌入式实践
  • Spark推荐系统踩坑实录:ALS调参、冷启动与实时推荐的那些事儿
  • 小米智能家居接入HomeAssistant终极指南:免费实现全屋自动化控制
  • 终极Flameshot截图工具完全指南:从零基础到专业标注
  • 自制STC单片机USB下载器:兼容3.3V/5V与RS232的稳定下载方案
  • 2026年滁州黄金回收白银回收铂金回收金条回收高口碑 5 家线下门店实地测评整理 - 信誉隆金银铂奢回收
  • 如何永久保存QQ空间记忆:GetQzonehistory的完整备份指南
  • 深入PL端:AXI GPIO软核与Zynq PS端硬核GPIO,到底该怎么选?