当前位置: 首页 > news >正文

cann/catlass Ascend950全解量化矩阵乘

57_ascend950_matmul_full_dequant Example Readme

【免费下载链接】catlass本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass

代码组织

├── 57_ascend950_matmul_full_dequant │ ├── CMakeLists.txt # CMake编译文件 │ ├── README.md │ └── matmul_full_dequant.cpp # 主文件
  • 支持的量化模式
X1的量化模式X2的量化模式带有Bias
per_tokenper_tensorFalse
per_tokenper_channelFalse
per_tensorper_channelFalse
defaultper_channelFalse
per_tokenper_tensorTrue
per_tokenper_channelTrue
defaultper_tensorTrue
defaultper_channelTrue

default模式:不采用任何量化模式

使用示例

  • 获取代码之后编译相应的算子可执行文件,可参考quickstart,本用例为Ascend 950算子,编译时需加-DCATLASS_ARCH=3510
  • 执行算子
# 编译指定用例 bash scripts/build.sh 57_ascend950_matmul_full_dequant -DCATLASS_ARCH=3510 # 生成测试样例 # cd examples/57_ascend950_matmul_full_dequant # python3 scripts/gen_data.py --shape "64 64 64" --x1_quant_mode per_token --x2_quant_mode per_channel # cd ../../output/bin # cp -r ../../examples/57_ascend950_matmul_full_dequant/input/ . # cp -r ../../examples/57_ascend950_matmul_full_dequant/output/ . # 可执行文件名 |矩阵m轴|n轴|k轴|x1QuantMode|x2QuantMode|isBias # isBias可选,默认为false ./57_ascend950_matmul_full_dequant 64 64 64 per_token per_channel

执行结果如下,说明精度比对成功。

Compare success.

【免费下载链接】catlass本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/782976/

相关文章:

  • 电子元器件焊接调试实战经验总结
  • Switch大气层系统深度配置:从零构建你的个性化游戏环境
  • 求推荐芜湖靠谱的装修公司?来看我的真实体验
  • CANN/metadef获取算子属性值接口
  • 2026自贡装修公司全案对标:从毛坯到拎包入住的一站式整装避坑指南 - 优质企业观察收录
  • 【研报 A104】AI康养深度研究报告:从辅助诊疗,到全周期照护操作系统
  • 如何借助Taotoken用量看板精准分析并优化团队的AI调用成本
  • AI医疗实战:构建鲁棒性青光眼筛查模型的多任务学习与部署策略
  • CANN算子测试总决赛
  • CANN/HCOMM线程读取归约操作
  • CANN Add算子Kernel执行样例
  • CANN/cann-recipes-infer:Kimi-K2-Thinking NPU推理
  • IT疑难杂症诊疗室:从蓝屏到勒索软件全攻略
  • 三步解锁QQ音乐加密文件:qmc-decoder让你的音乐真正自由播放
  • 深度剖析Go语言,一文告诉你为什么大厂开始增加Go的招聘量
  • AI与Web3.0融合:技术路径、挑战与实践指南
  • 小红书内容采集终极指南:5种高效下载方案全解析
  • 网络交换芯片:从25.6T到51.2T的技术演进与挑战
  • XUnity Auto Translator:如何在5分钟内为任何Unity游戏添加多语言支持
  • CANN/ops-cv双三次上采样梯度算子
  • CANN ops-math clamp算子
  • CANN/hccl:自定义通信算子 - 点对点通信
  • CANN/GE添加控制输入API
  • 如何通过数据分析功能解锁数据深度洞察?
  • 如何高效使用Mermaid Live Editor:5个提升技术文档质量的专业技巧
  • 从三星泄密事件看企业AI安全:LLM数据风险与社会中心AI框架
  • XHS-Downloader:小红书内容采集与批量处理的专业级解决方案
  • 购买域名多少钱一个?大家一般都在哪个平台购买?
  • CANN/atvoss加法运算符API文档
  • Oracle数据库开发最佳实践:构建高效、可维护的应用程序