当前位置: 首页 > news >正文

CANN/ascend-transformer-boost自定义算子开发指南

ATB加速库外部开发者自定义算子目录

【免费下载链接】ascend-transformer-boost本项目是CANN提供的是一款高效、可靠的Transformer加速库,基于华为Ascend AI处理器,提供Transformer定制化场景的高性能融合算子。项目地址: https://gitcode.com/cann/ascend-transformer-boost

介绍

单独为外部开发者设置开发目录,外部开发者可以按照本目录下的customize_block_copy Operation实现自定义算子。本目录支持单独编译和测试,也支持与ATB加速库一同编译。

使用说明

以customize_block_copy Operation为例

方式一:单独编译

安装CANN
chmod +x Ascend-cann-toolkit_$(version)_linux-$(arch).run ./Ascend-cann-toolkit_$(version)_linux-$(arch).run --install
安装后配置

配置环境变量脚本set_env.sh,当前安装路径以${HOME}/Ascend为例。

source ${HOME}/Ascend/ascend-toolkit/set_env.sh
安装NNAL
chmod +x Ascend-cann-nnal_$(version)_linux-$(arch).run ./Ascend-cann-nnal_$(version)_linux-$(arch).run --install
安装后配置

配置环境变量脚本set_env.sh,当前安装路径以${HOME}/Ascend为例。

source ${HOME}/Ascend/nnal/atb/set_env.sh
编译自定义算子目录
cd ascend-transformer-boost/ops_customize bash build.sh

该脚本目前支持:default|clean|unittest| --use_cxx11_abi=0|--use_cxx11_abi=1|--debug|--msdebug编译命令具体功能介绍:

  • default: 默认选项,构建ops_customize的内容
  • clean: 清理所有构建历史,删除构建目录
  • unittest: 构建单元测试,运行ops_customize的单元测试
  • --use_cxx11_abi=0: 禁用C++11 ABI
  • --use_cxx11_abi=1: 启用C++11 ABI
  • --debug: 设置构建类型为Debug模式
  • --msdebug: 启用MSDebug模式,用于对算子内核代码进行调测
执行测试用例

执行customize_block_copy Operation的测试用例

bash build.sh unittest

方式二:与ATB加速库一同编译

准备环境变量

当前安装路径以${HOME}/Ascend为例。

source ${HOME}/Ascend/ascend-toolkit/set_env.sh source ${HOME}/Ascend/nnal/atb/set_env.sh export ATB_BUILD_DEPENDENCY_PATH=${ATB_HOME_PATH}
编译带有自定义算子的ATB加速库
cd ascend-transformer-boost bash scripts/build.sh customizeops
执行测试用例

编译带有自定算子和测试用例的ATB加速库, 执行customize_block_copy Operation的测试用例

bash scripts/build.sh customizeops --customizeops_tests source ./output/atb/set_env.sh cd ./build/ops_customize/ops/customize_blockcopy/tests/ && ./customize_blockcopy_test

【免费下载链接】ascend-transformer-boost本项目是CANN提供的是一款高效、可靠的Transformer加速库,基于华为Ascend AI处理器,提供Transformer定制化场景的高性能融合算子。项目地址: https://gitcode.com/cann/ascend-transformer-boost

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/786688/

相关文章:

  • 告别物理串口线:com0com虚拟串口驱动全方位实战指南
  • Tracciatto:基于rdbg的Ruby调试环境增强套件详解
  • LangGraph:构建复杂AI工作流与有状态智能体的图计算框架
  • AI应用落地实战:从算法选型到工程部署的可持续架构
  • ARM汇编器FPU配置与性能优化指南
  • Arm CoreLink SSE-200安全架构与寄存器配置详解
  • React自定义光标组件cursorify:从原理到实战的完整指南
  • SpringBoot+Vue 在线招投标系统管理平台源码【适合毕设/课设/学习】Java+MySQL
  • AI增强型本地优先路线图规划器:可视化思维与智能协作
  • 如何用scrapy-pinduoduo构建电商数据智能分析管道
  • 基于Pix2Pix GAN的火山灰云卫星图像智能分割方法研究
  • kill-doc:浏览器文档下载神器,告别付费墙和登录限制
  • 开源TTS工具在低资源语言中的实战评估与优化
  • CANN/hcomm:获取组内rank ID
  • 使用Taotoken后API调用延迟稳定且账单清晰可追溯的实际感受
  • 基于大语言模型的科学实验报告自动评估系统设计与实践
  • SPI可编程死区+故障状态回读:STGAP1BSTR的智能化驱动配置方案
  • 双非拿下美团大模型Offer!我的面试复盘与血泪建议,小白也能看懂并收藏!
  • 汽车电子HIL测试:原理、实现与工程实践
  • 基于Milvus的zilliz-skill框架:从向量数据库到AI技能编排的范式跃迁
  • 华为/HCCL多QP通信阈值配置
  • LeetCode 155. 最小栈
  • 创业公司如何利用Taotoken聚合API低成本验证多个AI产品创意
  • 为什么封装越优雅的 SQL 跑得越慢?条件下推破解痛点
  • Webpack日志转发插件:将浏览器Console输出实时同步至终端
  • 如何在OpenClaw中配置Taotoken作为其AI能力供应商
  • 清华重磅揭秘:驾驭工程——让AI系统可信可控,引领未来科技新篇章!
  • 2026年4月工业节能风扇厂商推荐,永磁大风扇/工业风扇/工业节能风扇/工业排风扇,工业节能风扇直销厂家怎么选择 - 品牌推荐师
  • 车载以太网之要火系列 - 第36篇:郭大侠学SOME/IP - 忽闻江湖有新令,服务通信破天惊(SOA是个什么鬼)
  • 企业内网开发如何通过Taotoken统一管理多个大模型API密钥