当前位置: 首页 > news >正文

CANN/ops-transformer Chunk_gated_delta_rule算子测试框架

Chunk_gated_delta_rule算子测试框架

【免费下载链接】ops-transformer本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-transformer

功能说明

基于pytest测试框架,实现Chunk_gated_delta_rule算子的功能验证:

  • CPU侧:复现算子功能用以生成golden数据
  • NPU侧:通过torch_npu进行算子直调获取实际数据
  • 精度对比:进行CPU与NPU结果的精度对比验证算子功能

当前实现范围

参数限制

  • 支持batch_size大于0。
  • 支持seqlen序列长度。
  • 支持NK、NV head数,NV需要为NK倍数。
  • 支持DK、DV 不超过128。
  • 支持data_type为BF16。

环境配置

前置要求
  1. torch_npu安装包下载路径(需及时更换为最新版本):torch_npu安装教程
  2. 完成环境安装和环境变量配置,具体操作请参考:ops-transformer
custom包调用

支持custom包调用

文件结构

pytest文件结构说明
  • test_run.sh # 执行脚本
  • chunk_gated_delta_rule_golden.py # cpu侧算子golden实现以及cpu golden与npu结果精度对比
  • pytest.ini # 创建ci单算子和graph图模式的测试标记

单用例测试:

  • test_chunk_gated_delta_rule_single.py # 测试单用例运行主程序
  • chunk_gated_delta_rule_operator_single.py # CPU侧算子逻辑实现获取golden与npu算子直调
  • test_chunk_gated_delta_rule_paramset.py # 单用例入参配置

使用方法

在pytest文件夹路径下执行:

运行测试用例

单用例调测

1、手动配置test_chunk_gated_delta_rule_paramset.py的参数

2、执行指令:

bash test_run.sh single

【免费下载链接】ops-transformer本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-transformer

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/785933/

相关文章:

  • AI写专著必备:实测4款工具,快速产出20万字专著,查重不用愁!
  • 厦门装修哪个比较好
  • CANN基础设施OAT使用指南
  • CLAWHunter:基于WiFi Pineapple Pager的OpenClaw AI网关自动化侦察与渗透工具
  • 强化学习算法 —— 带自适应步长的策略梯度算法(PG算法、Adaptive step size for Adam optimizer)
  • cann/sip AsumOperation示例
  • 基于RAG与向量数据库构建个人AI知识库:从KnowMe项目看技术实现
  • CANN/ops-solver Sgetri算子测试
  • 2026年无锡GEO优化行业市场调研及3家优质服务商选型参考指南 - 产业观察网
  • CANN/community持续集成指南
  • AI算法黑箱的法律归责挑战:从技术原理到责任鸿沟
  • 【GaussDB】数据加密方式:函数加密、透明加密与全密态
  • OpenSpeedy终极指南:5分钟掌握免费开源游戏变速技巧
  • 抖音矩阵云混剪系统 源码短视频矩阵营销系统V2.3.0(免授权版)
  • AI赋能建筑工程电气电子工程:从自动化设计到智能运维的实践指南
  • 安达发|APS智能排产排程排单软件:重塑金属加工生产效能
  • 因果图与特征组合:构建人机协同的算法公平性分析工具
  • 终极指南:5分钟搭建个人游戏串流服务器Sunshine,免费玩转3A大作
  • 基于MCP协议构建AI助手与Google Docs的无缝集成方案
  • MoE、多模态与AGI:生成式AI的范式转移与核心技术融合
  • 深度解析NHSE:如何通过二进制逆向工程实现游戏存档的完全掌控
  • Seraphine终极指南:英雄联盟自动BP与战绩查询系统完整教程
  • Web 3.0中AI与边缘计算融合:从反洗钱到去中心化存储的实践
  • 机载声探测网络低信噪比声源定位与数据融合【附仿真】
  • CANN/ge CountBatch批处理功能
  • MoE与边缘AI融合:重塑元宇宙实时内容生成新范式
  • 开源AI管家JARVIS-:从多模型集成到智能家居控制实战
  • 数据智能前沿:从过程分析到可信AI的跨学科研究与实践
  • 主动学习加速广义Benders分解求解混合整数经济模型预测控制
  • AI Agent工具化实战:基于MCP协议构建安全可控的自动化工作流