当前位置: 首页 > news >正文

CANN/AMCT OFMR大模型量化

AMCT大模型量化

【免费下载链接】amctAMCT是CANN提供的昇腾AI处理器亲和的模型压缩工具仓。项目地址: https://gitcode.com/cann/amct

1 量化前提

1.1 安装依赖

本sample依赖包可参考requirements.txt

需要注意的是torch_npu包版本需要与Python、torch包版本相匹配,需要安装CANN包

1.2 模型和数据集准备

本sample以Llama2-7b,qwen2-7b,qwen3-8b模型,pileval数据,wikitext2数据集为示例。 模型请用户自行下载,并传模型路径到脚本,数据集为在线加载。

1.3 简易量化配置

本sample中使用的量化配置已经内置在工具中,可以通过下述方式获取并使用:

from amct_pytorch import HIFP8_OFMR_CFG

如果需要修改详细配置,请参考资料构造需要的量化配置dict。

ofmr算法支持仅权重量化和全量化,支持的量化类型以及量化配置:

字段类型说明取值范围注意事项
batch_numuint32量化使用的batch数量1/
skip_layersstr跳过量化的层/跳过量化层支持模糊匹配,当配置字符串为层名字串,或与层名一致时,跳过该层量化,不生成量化配置。字符串必须包含数字或字母
weights.typestr量化后权重类型'float8_e4m3fn'/'hifloat8'/
weights.symmtricbool对称量化TRUE/
weights.strategystr量化粒度'tensor'/'channel'/
inputs.typestr量化后激活值类型'float8_e4m3fn'/'hifloat8'/
inputs.symmtricbool对称量化TRUE/
inputs.strategystr量化粒度'tensor'/
algorithmdict量化使用的算法配置{'ofmr'}/

2 量化示例

2.1 使用接口方式调用

step 1.请在当前目录执行如下命令运行示例程序,用户需根据实际情况修改示例程序中的模型路径:

python3 src/run_llama2_samples.py --model_path=/data/Llama2_7b_hf/
python3 src/run_qwen_samples.py --model_path=/data/Qwen2-7b/
python3 src/run_qwen_samples.py --model_path=/data/Qwen3-8B/

若出现如下信息,则说明量化成功:

Test time taken: 1.0 min 59.24865388870239 s Score: 5.477707

其中Score为量化模型PPL,具体数值参考下表:

模型校准集数据集量化前PPL量化后PPL
LLAMA2-7Bpilevalwikitext25.4725.505
QWEN2-7Bpilevalwikitext27.1377.196
QWEN3-8Bpilevalwikitext29.7159.808

推理成功后,在当前目录会生成量化日志文件./amct_log/amct_pytorch.log

【免费下载链接】amctAMCT是CANN提供的昇腾AI处理器亲和的模型压缩工具仓。项目地址: https://gitcode.com/cann/amct

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/783731/

相关文章:

  • OpenClaw爬虫框架实战:从Awesome清单到自动化数据采集系统构建
  • 国内主流氯化镁生产厂家综合实力排行及选型指南 - 奔跑123
  • ngx_close_accepted_connection
  • 别再画丑图了!用Mermaid的gitGraph在Markdown里画专业Git分支图(附VSCode插件配置)
  • 基于OpenClaw构建多AI智能体协作平台:从数字生命蒸馏到理想国决策
  • 告别粘连字符!用Halcon的partition_dynamic算子精准分割OCR区域(附完整代码)
  • AI音乐生成技术解析:从符号与音频生成到混合模型实战
  • 向量引擎、deepseek v4、GPT Image 2、api key:Agent 时代最值钱的不是模型,是会调度的人
  • 外资阀门品牌2026市场介绍:米勒(Miller) - 米勒阀门
  • 基于微环谐振器的光子AI推理加速器:原理、设计与挑战
  • CANN算子测试竞赛中山大学软工小队提交
  • CANN/pypto lt函数API文档
  • 如何免费获取网盘高速下载:LinkSwift 九大平台直链解析终极指南
  • AI水下目标检测:从传统图像处理到深度学习部署实战
  • 工业盐技术选型指南:优质厂家的核心筛选维度 - 奔跑123
  • 别再只会用ref_table了!ABAP ALV里给自定义字段加F4搜索帮助的完整流程(附代码)
  • 深入SplaTAM代码:手把手解析3D高斯溅射(3DGS)如何与SLAM框架在Python/CUDA层协同工作
  • CANN/AMCT HiFloat8量化算法
  • 2026 全国节能建筑围护材料优质厂家 TOP5 榜单——聚焦聚氨酯复合板、聚氨酯封边岩棉夹芯板、聚氨酯夹芯板全国供应商 - 深度智识库
  • 2026年原创视频素材平台评测:国内项目与海外素材库的选型记录 - Fzzf_23
  • Ubuntu SCP传文件总失败?从ifconfig查IP到防火墙设置,保姆级排错指南
  • CANN LJForceFused算子测试报告
  • CANN/hcomm 算法分析器工具指南
  • CANN/pto-isa标量算术操作
  • 从C语言到机器码:用RV32I指令集手写一个简单的加法函数(附完整汇编代码)
  • 2026年原创视频素材平台清单:个人、企业和专业团队适用 - Fzzf_23
  • DAO治理自动化引擎:tomorrowDAO-skill架构解析与安全实践
  • CANN ops-math安全声明
  • 2026年罐用清洗球品牌推荐排行榜:旋转式、固定式、喷洒形、扇形清洗球优质之选! - 速递信息
  • 保姆级教程:用Python+Flask快速搭建一个边云协同推理的Demo(附代码)