当前位置: 首页 > news >正文

CANN/AMCT创建蒸馏模型API

create_distill_model

【免费下载链接】amctAMCT是CANN提供的昇腾AI处理器亲和的模型压缩工具仓。项目地址: https://gitcode.com/cann/amct

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

功能说明

蒸馏接口,将输入的待量化压缩的图结构按照给定的蒸馏量化配置文件进行量化处理,在传入的图结构中插入量化相关的算子(数据和权重的蒸馏量化层以及找N的层),返回修改后可用于蒸馏的torch.nn.Module模型。

函数原型

compress_model = create_distill_model(config_file, model, input_data)

参数说明

参数名

输入/输出

说明

config_file

输入

含义:用户生成的蒸馏量化配置文件,用于指定模型network中量化层的配置情况和蒸馏结构。

数据类型:string

使用约束:该接口输入的config.json必须和create_distill_config接口输入的config.json一致

model

输入

含义:待进行蒸馏量化的原始浮点模型,已加载权重。

数据类型:torch.nn.Module

input_data

输入

含义:模型的输入数据。一个torch.tensor会被等价为tuple(torch.tensor)。

数据类型:tuple

返回值说明

修改后可用于蒸馏的torch.nn.Module模型。

调用示例

import amct_pytorch as amct # 建立待进行蒸馏量化的网络图结构 model = build_model() model.load_state_dict(torch.load(state_dict_path)) input_data = tuple([torch.randn(input_shape)]) # 生成压缩模型 compress_model = amct.create_distill_model( config_json_file, model, input_data)

【免费下载链接】amctAMCT是CANN提供的昇腾AI处理器亲和的模型压缩工具仓。项目地址: https://gitcode.com/cann/amct

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/785634/

相关文章:

  • 开源OSINT终端Horus:构建本地优先的实时态势感知驾驶舱
  • 本地AI技能安全运行:基于MCP协议与沙盒隔离的Mac离线自动化方案
  • React:useTransition 超详细教程、为什么有了 Fiber,React 默认更新依然会卡顿?useDeferredValue超详细教程
  • ViGEmBus内核驱动深度解析:从系统架构到高级配置的完整技术指南
  • Scikit-learn:从问题到模型——监督学习的最小闭环
  • 将docx博客草稿转化为适于博客园发布的markdown文件
  • AI赋能可持续发展:从技术祛魅到实践审辨
  • CANN/asc-devkit:AlltoAllvWrite集合通信API
  • AI与Web 3.0深度融合:联邦学习、智能合约与AI代理的架构实践
  • 成都钢板代理商|专注西南板材一站式批发|获取盛世钢联免费钢板报价 - 四川盛世钢联营销中心
  • 海信扩大3C智能硬件版图,底气来自哪里?
  • 下肢外骨骼五连杆模型辨识与运动控制器设计【附仿真】
  • Webpack:Webpack 核心配置、什么是 Loader? 什么是plugin?webpack 构建流程
  • CANN/PTO-ISA文档导航
  • 昇腾CANN/ge常量折叠特性分析
  • AI赋能人才分析:从数据治理到模型落地的实战指南
  • 构式语法与人工智能融合:从可解释AI到具身智能体的语言理解新范式
  • AI金融研究13年文献计量分析:热点算法、应用场景与未来趋势
  • Flutter for OpenHarmony 交互体验实战合集:底部导航优化 + 萌系用户反馈全攻略
  • CsGrafeq: 比 Desmos 更“能折腾”的几何函数画板(.NET + Avalonia)
  • 金融时序预测可解释AI实战:从SHAP到LIME的模型透明度构建
  • MATLAB抽水蓄能电站系统的最优竞价策略研究附Matlab代码
  • 精简版Windows如何安装微软商城应用? Codex 离线安装教程
  • OpenClaw:本地优先的自主AI代理框架部署与实战指南
  • 5分钟快速上手:TranslucentTB让你的Windows任务栏透明化更简单
  • Python请求方式介绍:JSON、表单及其他常见数据传输格式
  • 缓存内存模型
  • 乳腺癌AI诊断:SHAP、Grad-CAM与LIME三大可解释技术实战对比
  • CANN/pto-isa事件与同步机制
  • 成都螺纹钢供应商|专注西南建筑钢材一站式批发|获取盛世钢联免费钢筋报价 - 四川盛世钢联营销中心