当前位置: 首页 > news >正文

CANNAMCT网络分解功能说明

decompose_network

【免费下载链接】amctAMCT是CANN提供的昇腾AI处理器亲和的模型压缩工具仓。项目地址: https://gitcode.com/cann/amct

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

功能说明

用户输入PyTorch模型对象和通过auto_decomposition保存的分解信息文件,根据分解信息文件将模型对象改变为张量分解后的结构,得到分解后的模型对象和分解前后层的对应名称。

函数原型

model, changes = decompose_network(model, decompose_info_path)

参数说明

参数名

输入/输出

说明

model

输入

含义:待分解的PyTorch模型对象。在调用该接口时建议将模型放置于CPU上,以防分解时显存不足。

数据类型:torch.nn.Module

decompose_info_path

输入

含义:分解信息文件路径,该文件通过auto_decomposition获得。

数据类型:string

返回值说明

  • 改变为张量分解后结构的模型对象,类型为torch.nn.Module。
  • 张量分解前后的对应层名构成的字典,类型为dict,形如{'conv1': ['conv1.0', 'conv1.1'], 'conv2': ['conv2.0', 'conv2.1'], ...}。

约束说明

  • 用户输入的模型需为torch.nn.Module类型的对象。
  • 本接口函数仅支持对通过torch.nn.Conv2d()构建的卷积的结构修改。
  • 用户输入的模型结构需与调用auto_decomposition获取分解信息文件时的模型结构一致,分解信息文件要与该模型结构配套使用。

调用示例

from amct_pytorch.tensor_decompose import decompose_network net = Net() # 构建用户模型对象 net, changes = decompose_network( # 加载分解信息文件,将模型结构修改为张量分解后的结构 model=net, decompose_info_path="decomposed_path/decompose_info.json" # 由auto_decomposition保存的分解信息文件路径 )

[!NOTE]说明:

  1. 当涉及模型训练时,本接口的调用需在将模型参数传递给优化器之前;如使用了torch.nn.parallel.DistributedDataParallel (DDP),则本接口的调用也需在将模型传递给DDP之前。
  2. 本接口将原地修改传入的模型对象,即分解后会改变用户传入的模型对象本身(例外:传入的模型是一个torch.nn.Conv2d对象,该情况下本接口不会对其进行修改,返回的分解后模型是新构建的torch.nn.Module对象)。
  3. 本接口仅对模型结构进行修改,不会更新分解后的卷积权重,权重的值为torch.nn.Conv2d()构建的默认值。如需fine-tune,请在调用auto_decomposition后将分解后的模型权重保存下来,在调用本接口之后加载该权重,再进行fine-tune。

【免费下载链接】amctAMCT是CANN提供的昇腾AI处理器亲和的模型压缩工具仓。项目地址: https://gitcode.com/cann/amct

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/787072/

相关文章:

  • 基于Next.js的ChatGPT Web应用开发:从架构设计到部署实战
  • 深度解析Claude Code CLI:基于LLM的智能命令行工具架构与实现
  • AI智能体驱动无代码开发:从自然语言指令到完整Web应用实战
  • 彻底清理Windows右键菜单:ContextMenuManager可视化管理指南
  • AI文本检测性能评估:从混淆矩阵到ROC曲线的实战解析
  • 2026年评价高的美的空调/美的中央空调专业公司推荐 - 行业平台推荐
  • 毕业设计 大数据校园卡数据分析系统(源码+论文)
  • CANN/sip复数矩阵批量乘法
  • slim-mcp:为AI Agent工具列表智能瘦身,节省70%上下文Token
  • 2026年北京市外资研发中心认定申报要点
  • 5分钟实战指南:掌握Xenos Windows DLL注入器的完整操作流程
  • Nodejs后端服务如何接入Taotoken多模型API接口
  • 河北沧州企业认定市级、省级、国家级企业技术中心有多少奖补?
  • 如何在本地 Docker 环境中部署 DeepSeek API 转发网关服务
  • 基于Kubernetes Operator的大模型推理服务云原生部署实践
  • CANN/opbase SmallVector接口
  • 2025年东莞高职院校深度解析:广东酒店管理职业技术学院凭什么成为本地学子首选? - 品牌策略师
  • 2026年4月市面上诚信的复叶槭批发基地种植推荐,紫薇/红叶李/金森女贞/丝棉木/苗木/红叶石楠,复叶槭批发基地种植推荐 - 品牌推荐师
  • 申请高新技术企业需要几个专利?有要求吗?
  • 终极输入法词库转换指南:3分钟搞定20+输入法格式迁移
  • Python如何下载文件:从基础到进阶的完整指南
  • Godot 4双网格瓦片地图系统:解耦逻辑与渲染的进阶实践
  • APC:统一管理AI编程工具配置,告别配置孤岛与同步困境
  • Video DownloadHelper CoApp终极指南:从零开始高效下载与转换视频
  • DeepSeek-TUI:终端里的 AI 编码 Agent
  • Lumberjack Theme:基于TypeScript引擎的精准VS Code主题设计与工程实践
  • G-Helper完整指南:5分钟掌握华硕笔记本终极控制工具
  • GitHub Actions部署AI智能体:零成本实现代码仓库自动化管理与自我进化
  • 深度强化学习驱动的AIGC语义通信资源分配优化框架详解
  • VPM:硬件设计的包管理器革命,解决Verilog依赖管理难题