当前位置: 首页 > news >正文

CANN/AMCT线性量化训练API文档

LinearQAT

【免费下载链接】amctAMCT是CANN提供的昇腾AI处理器亲和的模型压缩工具仓。项目地址: https://gitcode.com/cann/amct

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

功能说明

构造Linear的QAT算子。

函数原型

  • 直接构造接口:

    qat = amct_pytorch.nn.module.quantization.linear.LinearQAT(in_features, out_features, bias, device, dtype, config)
  • 基于原生算子构造接口:

    qat = amct_pytorch.nn.module.quantization.linear.LinearQAT.from_float(mod, config)

参数说明

表 1直接构造接口参数说明

参数名

输入/输出

说明

in_features

输入

含义:输入特征数。

数据类型:int

out_features

输入

含义:输出特征数。

数据类型:int

bias

输入

含义:是否开启偏置项参与学习。

数据类型:bool,其他数据类型(比如整数,字符串,列表等)按照Python真值判断规则转换。

默认值为True

device

输入

含义:运行设备。

默认值:None

dtype

输入

含义:torch数值类型。

数据类型:torch数据类型,仅支持torch.float32

config

输入

含义:量化配置,配置参考样例如下,量化配置参数的具体说明请参见量化配置参数说明。

config = { "retrain_enable":true, "retrain_data_config": { "dst_type": "INT8", "batch_num": 10, "fixed_min": False, "clip_min": -1.0, "clip_max": 1.0 }, "retrain_weight_config": { "dst_type": "INT8", "weights_retrain_algo": "arq_retrain", "channel_wise": False } }

数据类型:dict

默认值:None

表 2基于原生算子构造接口

参数名

输入/输出

说明

mod

输入

含义:待量化的原生Linear算子。

数据类型:torch.nn.Module

config

输入

含义:量化配置。配置参考样例如下,量化配置参数的具体说明请参见量化配置参数说明。

config = { "retrain_enable":true, "retrain_data_config": { "dst_type": "INT8", "batch_num": 10, "fixed_min": False, "clip_min": -1.0, "clip_max": 1.0 }, "retrain_weight_config": { "dst_type": "INT8", "weights_retrain_algo": "arq_retrain", "channel_wise": False } }

数据类型:dict

默认值:None

返回值说明

  • 直接构造:返回构造的QAT单算子实例。
  • 基于原生算子构造:torch.nn.Module转化后的QAT单算子。

调用示例

  • 直接构造:

    from amct_pytorch.nn.module.quantization.linear import LinearQAT LinearQAT(in_features=1, out_features=1, bias=True, device=None, dtype=None, config=None)
  • 基于原生算子构造:

    import torch from amct_pytorch.nn.module.quantization.linear import LinearQAT linear_op = torch.nn.Linear(in_features=1, out_features=1, bias=True, device=None, dtype=None) LinearQAT.from_float(mod=linear_op, config=None)

【免费下载链接】amctAMCT是CANN提供的昇腾AI处理器亲和的模型压缩工具仓。项目地址: https://gitcode.com/cann/amct

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/784196/

相关文章:

  • AI与经济学交叉研究:文献计量分析揭示范式革命与前沿趋势
  • 冀暖甄选,品质随行——河北地源热泵优选品牌伯朗宁(BROWNING) - 速递信息
  • 边开发AI Agent边学习:容器化开发与部署全指南
  • 3分钟让你的Windows右键菜单变得清爽高效:ContextMenuManager使用全攻略
  • 使用Taotoken后API调用延迟与用量可视化的实际体验
  • SALE框架:基于拍卖机制的异构LLM任务分配优化
  • AI驱动城市碳排放报告成熟度模型:从数据治理到智能决策
  • IP6525S 最大输出 22.5W,集成快充输出协议(DCP/QC2.0/QC3.0/FCP/AFC/SFCP/MTK/SCP/VOOC)的降压 SOC
  • 从PageHelper切换到Mybatis-Plus分页插件,我踩了这些‘多表查询’的坑(附完整迁移对比)
  • CANN pi0机器人VLA大模型昇腾推理指南
  • zabbix去除监控项默认返回的字符
  • CANN/sip BLAS Iamax函数文档
  • Swift测试技能库:模块化设计、异步测试与SwiftUI集成实践
  • CTP-API实战避坑:用Python处理报单与成交回报的顺序问题(附完整代码)
  • 2026年昆明代理记账与企业财税服务深度横评|云南工商变更一站式解决方案 - 年度推荐企业名录
  • 保姆级教程:用Python 3.9和OpenXLab CLI/SDK下载AI数据集(附ImageNet-21k实战)
  • AI搜索引流排行榜|2026实测盘点,做AI引流必参考 - FaiscoJeff
  • Argo CD实战指南:基于GitOps的Kubernetes持续交付核心原理与生产级部署
  • 达梦常见问题2
  • AI驱动的物联网数据质量评估与增强:从原理到工程实践
  • IP6537 集成 Type-C PD3.0(PPS)等 14 种快充协议的降压 SoC
  • 选对仪器事半功倍 日立原子吸收仪领跑工业检测 - 博客万
  • 2026年收纳整理家居神器京东代运营十大品牌专业深度测评与排名前五权威发布 - 电商资讯
  • 2026年数据经营分析平台选型,智慧大脑企业推荐合集 - 讯息观点
  • 别再只盯着NFC卡了!聊聊CCC数字钥匙里那个关键的‘身份证’——AID
  • 别再让浮点运算拖慢你的STM32F4!手把手教你开启M4内核的FPU并配置CMSIS-DSP库
  • Claude API 频繁报 529 overloaded_error 怎么解决?(踩坑3天的真实记录)
  • 2026年西北印刷行业深度横评:西安画册印刷厂、台历挂历与广告扇定制一站式解决方案 - 企业名录优选推荐
  • 推荐几家信誉好的行车式刮吸泥机公司,哪个品牌好?哪家实力强?哪家售后服务好? - 品牌推荐大师1
  • Xata Agent:基于大语言模型的PostgreSQL智能运维助手实战指南