当前位置: 首页 > news >正文

cann/ascend-transformer-boost编译与构建

编译与构建

【免费下载链接】ascend-transformer-boost本项目是CANN提供的是一款高效、可靠的Transformer加速库,基于华为Ascend AI处理器,提供Transformer定制化场景的高性能融合算子。项目地址: https://gitcode.com/cann/ascend-transformer-boost

ATB编译

下载加速库源码

git clone https://gitcode.com/cann/ascend-transformer-boost.git

您可自行选择需要的分支。

编译

进入加速库的根目录,编译

cd ascend-transformer-boost bash scripts/build.sh

注意:该编译过程涉及①拉取算子库/MKI并编译以及②加速库的编译两个过程。更多命令介绍可查看atb仓主目录下的README.mdscripts/build.sh文件。

ATB编译相关说明

ATB的基本编译命令是bash build.sh,默认构建模式下生成版本信息,并创建安装包(默认情况下不会编译python接口)。后可跟参数,实现不同功能:

  • --use_cxx11_abi=1:启用C++11 ABI
  • --use_cxx11_abi=0:禁用C++11 ABI
  • --verbose:开启编译详细输出
  • --asan:启用内存错误检测,并强制设置为Debug模式
  • --skip_build:跳过构建过程
  • --debug:设置构建类型为Debug模式
  • --msdebug:启用MSDebug模式,用于对算子内核代码进行调测
  • --ascendc_dump:启用AscendC_Dump模式,用于对算子内核代码进行调测
  • --clean-first:构建前清理所有构建历史,删除构建目录
  • --src-only:仅构建源码
  • --torch_atb: 编译pybind11并生成whl包,随后pip安装即可使用python接口
  • --customizeops_tests: 构建ops_customize的单元测试
  • default: 默认选项,构建ATB加速库的内容
  • testframework:构建测试框架,生成版本信息,并打包测试框架
  • unittest:构建单元测试,运行内核接口测试和单元测试
  • kernelunittest:构建内核单元测试,运行内核单元测试
  • pythontest:构建 Python 测试,运行 Python 测试
  • kernelpythontest:构建内核 Python 测试,运行内核 Python 测试
  • torchatbtest:构建 Torch ATB 测试,运行 Torch ATB 测试
  • csvopstest:构建 CSV 操作测试,运行 CSV 操作测试
  • infratest:构建基础设施测试,运行基础设施测试
  • hitest:构建 HiTest,设置 HiTest 环境变量,生成版本信息,打包测试框架和 HiTest
  • fuzztest:构建模糊测试,生成模糊测试用例运行模糊测试
  • alltest:构建所有测试,运行所有测试
  • clean:清理所有构建历史,删除构建目录
  • gendoc:生成文档
  • customizeops:构建ops_customize的内容,生成版本信息,并创建安装包

ATB关键文件介绍

  1. scripts目录:
    • install.sh: 安装脚本
    • uninstall.sh: 卸载脚本
    • build.sh: 编译脚本
    • release.sh:全自动构建与打包脚本
  2. include/atb目录:
    • set_env.sh:ATB的环境变量设置文件
  3. output目录:
    • version.info:版本信息
    • {arch}/Ascend-cann-atb_{version}_linux-{arch}.run:编译出的atb包
  4. output/atb/cxx_abi_0/lib目录(或output/atb/cxx_abi_1/lib,与abi版本有关):
    • libatb.so:Transformer加速库的动态链接库文件
    • libasdops.so:算子包的动态链接库文件
  5. ops_configs目录:
    • atb_ops_info.ini:算子输入输出规格描述文件

配置文件

编译文件build.sh

文件名:scripts/build.sh
加速库编译文件,文件中可设置日志存放目录、日志文件、编译器版本等,一般无需更改。

环境变量设置文件set_env.sh

文件名​:scripts/set_env.sh
加速库安装完成后,提供进程级环境变量设置脚本set_env.sh,以自动完成环境变量设置,用户进程结束后自动失效。 若想查看相关变量含义说明,可访问环境变量参考-昇腾社区。

【免费下载链接】ascend-transformer-boost本项目是CANN提供的是一款高效、可靠的Transformer加速库,基于华为Ascend AI处理器,提供Transformer定制化场景的高性能融合算子。项目地址: https://gitcode.com/cann/ascend-transformer-boost

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/782622/

相关文章:

  • 基于 OpenCV + OpenGL 的三维重建代码实现
  • Video DownloadHelper CoApp终极指南:轻松下载网络视频的完整教程
  • 企业级即时通讯「删除消息」:六个场景叠加之后,复杂性超出你的想象
  • # 026 Agent 的文件处理:PDF、Excel、图片、音频的解析与生成
  • 2026年唐山烟道清洗、外墙保洁与商业保洁一站式解决方案深度指南 - 企业名录优选推荐
  • 免费文本挖掘神器KH Coder:三步掌握多语言内容分析技巧
  • 项目改造为 Docker 容器使用指南
  • 不想打工开茶店,预算30万小成本中端预算创业,加盟岩茶品牌哪个不踩坑新手小白全程带教白皮书——以溪谷留香为基准样本的深度决策指南 - 商业科技观察
  • 模型广场功能如何帮助开发者根据任务特性选择合适模型
  • Seraphine:英雄联盟终极智能辅助工具完整指南 - 提升排位胜率的秘密武器
  • PUBG罗技鼠标宏压枪脚本架构揭秘:精准射击的自动化实现方案
  • Java并发编程:从基础到实战的技术探索
  • 性价比高的芯片老化座哪家公司好?
  • Atom编辑器终极中文汉化指南:告别英文困扰,轻松打造专属编程环境
  • 5分钟搭建专业级拼多多数据采集系统:电商运营的终极利器
  • 证书链技术与ADAC安全调试协议详解
  • 2026年唐山烟道清洗与外墙保洁一体化解决方案深度横评 - 企业名录优选推荐
  • FPGA开发实战:Verilog模块库pConst/basic_verilog深度解析与应用指南
  • 深度学习水印去除:无训练图像修复的终极实战方案
  • 如何用FastbootEnhance轻松管理Android设备:Windows终极图形化工具箱指南
  • CANN/ge:昇腾图引擎GE
  • pi0机器人VLA大模型昇腾推理优化
  • 有没有想有偿帮写贪吃蛇编程大作业的(C语言)
  • CANN/hccl AllGatherV接口文档
  • Python 智能体实战:从 0 搭建模块化 Agent 路由系统,落地小龙虾门店运营助手
  • pywencai实战指南:3大场景解决金融数据抓取难题
  • 2026年深圳民办初中择校观察:规范办学提质效,华朗学校成优质选择 - 深度智识库
  • 2026年唐山外墙清洗、烟道保洁与商业保洁服务商深度评测指南 - 企业名录优选推荐
  • 还在被本科终稿 PUA?Paperxie 这波操作直接让你从秃头党变过审王
  • 关于rhel8中的authselect、nss、ipa、pam、sssd、ldap等组件的理解