当前位置: 首页 > news >正文

CANN/cann-bench评测平台快速入门指南

快速入门

【免费下载链接】cann-bench评测AI在处理CANN领域代码任务的能力,涵盖算子生成、算子优化等领域,支撑模型选型、训练效果评估,统一量化评估标准,识别Agent能力短板,构建CANN领域评测平台,推动AI能力在CANN领域的持续演进。项目地址: https://gitcode.com/cann/cann-bench

文档版本:V0.2.0

本文档介绍如何使用评测工程进行算子代码生成评测。

前置条件

  • Python 3.8+
  • PyTorch 2.0+
  • torch_npu(NPU 模式)
  • CANN 环境(NPU 模式)

安装

pip install -e .

评测命令

从源码目录评测(推荐)

自动扫描、编译、安装 AI 生成的算子源码:

./scripts/run_evaluation.sh --source-dir /path/to/ai_ops

评测指定算子

# 评测指定目录 ./scripts/run_evaluation.sh --task-dir kernel_bench/level1 # 评测单个算子目录 ./scripts/run_evaluation.sh --task-dir kernel_bench/level1/exp # 按算子名称筛选 ./scripts/run_evaluation.sh --operator Exp # 评测单个用例 ./scripts/run_evaluation.sh --operator Exp --case-id 1 # CPU 模式评测 ./scripts/run_evaluation.sh --device cpu --operator Exp # 设置 warmup/repeat 参数 ./scripts/run_evaluation.sh --operator Exp --warmup 5 --repeat 10

多卡并行评测

不指定--device-id时自动使用全部可用 NPU 卡:

# 多卡并行(自动检测) ./scripts/run_evaluation.sh --operator Exp # 指定每卡进程数 ./scripts/run_evaluation.sh --operator Exp --processes-per-card 4 # 指定进程超时 ./scripts/run_evaluation.sh --operator Exp --timeout-per-process 600

单卡评测

# 单卡模式(指定设备 ID) ./scripts/run_evaluation.sh --device-id 0 --operator Exp

查看算子信息

# 列出所有算子 ./scripts/run_evaluation.sh -a list # 查看算子详情 ./scripts/run_evaluation.sh -a info --operator Exp # 查看配置 ./scripts/run_evaluation.sh -a config

高级选项

参数说明默认值
--device <type>设备类型 (cpu/npu)npu
--device-id <id>NPU 设备 ID(不指定则多卡并行)None
--processes-per-card <n>每卡进程数(多卡模式)2
--timeout-per-process <n>单进程超时(秒)300
--warmup <n>预热次数3
--repeat <n>采集次数5
--no-perf关闭性能采集(仅精度验证)False
--profiler-level <level>Profiler 级别 (Level1/Level2)Level1
--op-timeout-sec算子评测超时时间(秒)240
--no-subprocess-isolation关闭子进程隔离False(开启)
--no-iterative-compile关闭迭代隔离编译False(开启)

测试脚本

使用tests/run_simple.py进行 Golden 验证:

# CPU 简单验证 ./scripts/run_test.sh --cpu --operator Exp # NPU 模拟评测(Golden 伪装成 AI 算子) ./scripts/run_test.sh --npu --operator Exp # 指定设备 ID ./scripts/run_test.sh --npu --device-id 1 --operator Exp # 多卡并行 ./scripts/run_test.sh --npu --operator Exp

评测报告

评测完成后,报告输出到reports/目录:

  • reports/eval_report.json:JSON 格式详细报告
  • reports/eval_report.md:Markdown 格式报告
  • reports/summary.md:摘要报告
  • reports/prof_data/:性能采集数据

下一步

  • 贡献指南:如何提交新算子评测任务
  • 评测基准规范:算子定义和精度标准
  • 评测工程设计:评测器架构设计
  • 性能采集设计:性能采集机制设计

【免费下载链接】cann-bench评测AI在处理CANN领域代码任务的能力,涵盖算子生成、算子优化等领域,支撑模型选型、训练效果评估,统一量化评估标准,识别Agent能力短板,构建CANN领域评测平台,推动AI能力在CANN领域的持续演进。项目地址: https://gitcode.com/cann/cann-bench

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/784112/

相关文章:

  • StateLM:大语言模型的自主上下文管理技术解析
  • 对比直接使用原生API与通过Taotoken聚合调用的账单清晰度差异
  • CANN/opbase预留执行器接口
  • CANN / pto-isa PTO Tile 内部函数编程模型
  • SORONA生物基材料2026革新之作,重塑可持续时尚 - 品牌种草官
  • 2026年昆明短视频运营与AI全网推广完整指南|本地化精准获客与转化体系 - 年度推荐企业名录
  • TTT-Discover框架:强化学习在科学发现中的动态适应
  • 2026年4月优质的半自动钉箱机源头厂家推荐,市场半自动钉箱机选哪家 - 品牌推荐师
  • AI增强型网络弹性框架PHOENI2X:关键基础设施安全防御新范式
  • 国产高频红外碳硫分析仪品牌市场表现分析 - 品牌推荐大师
  • edict:专为开发者设计的离线命令行词典工具
  • 魔兽争霸3优化工具:让你的经典游戏焕然一新的完整指南
  • 别再用Time Machine了!针对Intel老Mac的三种‘精准’系统恢复方案实测(2015-2019款适用)
  • 基于MCP协议实现AI助手与n8n自动化平台的无缝集成
  • 基于Signal协议构建自托管加密通信服务器:从原理到部署实践
  • ProcessGPT:生成式AI如何重塑业务流程管理的未来
  • AI应用后端快速开发:基于开源模板的生产级工程实践
  • CANN/catlass Block MMAD开发详解
  • 2026年5月国内信号隔离器品牌TOP10大盘点 - 仪表人叶工
  • 扩散模型与多模态掩码的精准图像编辑技术
  • 技术人如何用工程化思维提升学术写作效率:从工具链到结构化思维
  • CANN/xla-npu BatchMatMul优化
  • FFmpeg QSV滤镜实战:解决`get_buffer() failed`报错的两种内存访问方案对比
  • CANNBot: RoPE预计算参考
  • Taotoken的API Key管理与访问控制功能实践分享
  • 2026 年活性炭箱厂家权威排行榜 TOP5 - 小艾信息发布
  • Dart factory构造函数避坑指南:和普通构造函数的5个关键区别与性能影响
  • ARM架构TLB操作与缓存锁定机制详解
  • CANN/pyasc API文档自动生成工具使用指南
  • AI医疗在非洲的落地实践:机遇、挑战与四步走策略