当前位置: 首页 > news >正文

CANN/AMCT自动通道稀疏搜索

auto_channel_prune_search

【免费下载链接】amctAMCT是CANN提供的昇腾AI处理器亲和的模型压缩工具仓。项目地址: https://gitcode.com/cann/amct

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

功能说明

自动通道稀疏接口,根据用户模型来计算各通道的稀疏敏感度(影响精度)以及稀疏收益(影响性能),然后搜索策略依据该输入来搜索最优的逐层通道稀疏率,以平衡精度和性能。最终输出一个配置文件。

函数原型

auto_channel_prune_search(model, config, input_data, output_cfg, sensitivity, search_alg)

参数说明

参数名

输入/输出

说明

model

输入

含义:待稀疏的PyTorch模型。

数据类型:torch.nn.Module

config

输入

含义:自动通道稀疏配置文件路径。

基于basic_info.proto文件中的AutoChannelPruneConfig生成的简易配置文件,*.proto文件所在路径为:AMCT安装目录/amct_pytorch/proto/。

*.proto文件参数解释以及生成的自动通道稀疏搜索配置文件样例请参见自动通道稀疏搜索简易配置文件。

数据类型:string

input_data

输入

含义:用户提供获取输入数据(含label)。

数据类型:list[data,label],列表元素数据类型为torch.tensor。

output_cfg

输入

含义:输出的最终的通道稀疏配置文件路径。

数据类型:string

sensitivity

输入

含义:敏感度计算方法。

数据类型:string或SensitivityBase的子类,string为AMCT已有的方法,目前可选为'TaylorLossSensitivity';SensitivityBase的子类实例化,可由用户来继承定义。

search_alg

输入

含义:待稀疏的通道搜索方法。

数据类型:string或SearchChannelBase的子类,string为AMCT已有的方法,目前可选为'GreedySearch';SearchChannelBase的子类实例化,可由用户来继承定义。

返回值说明

调用示例

import amct_pytorch as amct #构造输入数据input_data input_data = torch.randn(input_shape) model.eval() output = model.forward(input_data) labels = torch.randn(output.size()) data = [input_data,labels] amct.auto_channel_prune_search( model=model, config='./tmp/sample.cfg', input_data=data, output_cfg='./tmp/output.cfg', sensitivity='TaylorLossSensitivity', search_alg='GreedySearch')

落盘文件说明:

保存的自动通道稀疏配置文件,需要传给通道稀疏接口完成后续的业务。

【免费下载链接】amctAMCT是CANN提供的昇腾AI处理器亲和的模型压缩工具仓。项目地址: https://gitcode.com/cann/amct

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/787189/

相关文章:

  • 全域数学·宇宙终极形状定论-全域数学揭开的宇宙终极形状
  • 梦笔记20260509
  • 2026年4月车况优质的二手车销售源头门店推荐,诚信承诺打造二手车买卖好品牌 - 品牌推荐师
  • ARM MBIST控制器架构与存储测试技术详解
  • 2026年知名的赣州工程铝材/赣州工程铝型铝材厂家选择推荐 - 品牌宣传支持者
  • Git Launcher:AI驱动的一站式项目发布自动化工具详解
  • 英雄联盟智能助手Seraphine:3分钟实现自动BP与战绩分析的终极指南
  • RNN在非线性模型预测控制中的高效安全应用
  • 从零构建RISC-V处理器:开源Riskow项目详解与FPGA实践
  • 知识蒸馏与Transformer在能源管理中的轻量化实践
  • 卷十二:奔跑吧水轮·环境能捕获与全域熵源 (正式典籍版)
  • Claude Code 部署指南:本地开发与远程服务器环境下的安装与配置实战
  • autobe:简化后端服务自动化测试与构建流程的开源工具集
  • CANN/ops-blas Iamax算子实现
  • AI驱动蛋白质工程:从监督学习到生成模型的技术演进与实践
  • .switchClass() 方法详解
  • 2026南京大宅装修设计公司推荐:南京别墅全案装修设计公司实力深度解析 - 栗子测评
  • 端到端自动驾驶的可解释AI与不确定性量化:从黑盒到透明决策
  • 设计需求拆解指南:颜色、字号、位置等参数化才是可执行项
  • GTA5线上小助手:3分钟零基础入门指南,让你在洛圣都如鱼得水!
  • 3步搞定Atom编辑器完整中文汉化:告别英文困扰的终极指南
  • ChatMock:本地AI模型与OpenAI API兼容的代理服务器部署与实战
  • 基于LLM的GitHub智能助手:从事件驱动架构到提示词工程实践
  • AI编程助手高效协作:Cursor Vibe Coding模板配置与实战
  • 南京自建房装修设计公司推荐:2026南京口碑好的软装装修设计公司全维度测评 - 栗子测评
  • 数字孪生安全挑战:从CPS架构脆弱性到AI增强攻击的防御之道
  • LangGraph 初探:为什么多智能体编排需要图计算?
  • CANN Lennard-Jones力场API参考
  • RAG-Fusion:多查询与排序融合技术如何提升大模型检索效果
  • CAN协议在工业自动化中的应用与高层协议解析