当前位置: 首页 > news >正文

CANN/AMCT KV-Cache量化模型创建

create_quant_cali_model

【免费下载链接】amctAMCT是CANN提供的昇腾AI处理器亲和的模型压缩工具仓。项目地址: https://gitcode.com/cann/amct

产品支持情况

产品

是否支持

Ascend 950PR/Ascend 950DT

Atlas A3 训练系列产品 / Atlas A3 推理系列产品

Atlas A2 训练系列产品 / Atlas A2 推理系列产品

注:标记“x”的产品,调用接口不会报错,但是获取不到性能收益。

功能说明

KV-cache量化接口,根据模型和量化详细配置,对用户模型进行改图,将待量化Linear算子替换为输出后进行IFMR/HFMG量化的量化算子,后续用户拿到模型后进行在线校准,校准后生成量化因子保存在record_file中。

函数原型

calibration_model = create_quant_cali_model(config_file, record_file, model)

参数说明

参数名

输入/输出

说明

config_file

输入

含义:生成的量化配置文件路径,配置文件为JSON格式。

数据类型:string

使用约束:该接口输入的config.json必须和create_quant_cali_config接口输入的config.json一致

record_file

输入

含义:在线校准量化因子保存的路径及文件名称。

数据类型:string

model

输入

含义:用户提供的待量化模型。

数据类型:torch.nn.Module

返回值说明

替换为校准算子的量化校准模型。

调用示例

import amct_pytorch as amct # 建立待进行量化的网络图结构 model = build_model() model.load_state_dict(torch.load(state_dict_path)) record_file = os.path.join(TMP, 'kv_cache.txt') # 插入量化API,生成量化校准模型 calibration_model = amct.create_quant_cali_model( config_file="./configs/config.json", # 生成的量化因子记录文件 record_file, model)

【免费下载链接】amctAMCT是CANN提供的昇腾AI处理器亲和的模型压缩工具仓。项目地址: https://gitcode.com/cann/amct

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/784800/

相关文章:

  • 乡村全科执业医师培训机构哪个好?这份2026最新调研报告告诉你 - 医考机构品牌测评专家
  • RT2.0 动态 Shape 执行器特性分析
  • 从“算力竞赛”到“业务落地”:AI营销一体机选型的几点思考
  • Java老兵转型AI开发实战指南:收藏这份从零到精通的学习路线,小白也能快速上手大模型
  • 2026年4月靠谱的通风蝶阀厂家推荐,电动组合风阀/岗位轴流风机/吊顶式空调机组/通风蝶阀,通风蝶阀门店找哪家 - 品牌推荐师
  • 避坑指南:在CentOS7上为TensorFlow2.6搭建Python3.8环境,我踩过的那些‘依赖’雷
  • Swift-All实战:用T4显卡微调7B大模型,一小时成本不到5块钱
  • 深度学习赋能医学影像:COVID-19检测与病灶分割技术全解析
  • 淘金币自动化脚本终极指南:如何每天5分钟完成淘宝全任务
  • 2025届毕业生推荐的五大降AI率工具横评
  • 高校研究小组如何借助Taotoken低成本使用多种大模型进行实验
  • CANN推理优化实践:Kimi-K2-Thinking
  • 连云港本地CPPM官方授权报名中心及联系方式 - 众智商学院课程中心
  • CANN/ge Profiling特性介绍
  • 从Transformer到对齐:大语言模型完整技术栈与实战解析
  • 搞定OpenWrt下Sane移动端扫描的‘最后一公里’:一个Go程序的编译与部署实战
  • CANN驱动设备兼容查询
  • 大模型部署的社会风险与三层治理框架:从技术可控到社会可信
  • AI安全实战:从内容溯源到红队演练构建可信AI系统
  • 5分钟让小爱音箱变身AI语音助手:MiGPT完整指南
  • 面试官最爱问的同步FIFO细节:空满信号用组合逻辑还是时序逻辑?实战避坑指南
  • 唐山本地CPPM官方授权报名中心及联系方式 - 众智商学院课程中心
  • 黄仁勋:中国不仅有“鬼数据中心”,还有庞大的能源、芯片、AI人才优势
  • CANN/metadef数值兼容性检查
  • 还在手动逐句转写录音提取文字?2026年亲测这4款AI工具,10分钟搞定2小时录音
  • 2026苏州太阳能电池板回收公司推荐榜,正规企业优选 - 企业推荐师
  • 基于MFDFA、传递熵与Kuramoto模型的EEG信号特征工程实践
  • 湖州本地CPPM官方授权报名中心及联系方式 - 众智商学院课程中心
  • 用PyTorch手把手教你搭建PINN:从Burgers方程到3D可视化(附完整代码)
  • 基于MCP协议构建Slack AI助手:开源社区项目slack-mcp-community实践指南