当前位置: 首页 > news >正文

CANN/ascend-transformer-boost LinearParallelOperation C++示例

加速库LinearParallelOperation C++ Demo

【免费下载链接】ascend-transformer-boost本项目是CANN提供的是一款高效、可靠的Transformer加速库,基于华为Ascend AI处理器,提供Transformer定制化场景的高性能融合算子。项目地址: https://gitcode.com/cann/ascend-transformer-boost

介绍

该目录下为加速库LinearParallelOperation C++调用示例。

使用说明

  • 首先source 对应的CANN和nnal包的安装路径

    1. source [cann安装路径]/set_env.sh 默认:source /usr/local/Ascend/ascend-toolkit/set_env.sh
    2. source [nnal安装路径]/set_env.sh
      默认:source /usr/local/Ascend/nnal/atb/set_env.sh
      ①. 如果使用加速库源码编译,source [加速库源码路径]/output/atb/set_env.sh
      例如: source ./ascend-transformer-boost/output/atb/set_env.sh
  • 运行demo

    bash build.sh

    注意

    • 使用cxx_abi=0(默认)时,设置D_GLIBCXX_USE_CXX11_ABI为0,即:

      g++ -D_GLIBCXX_USE_CXX11_ABI=0 -I ...
    • 使用cxx_abi=1时,更改D_GLIBCXX_USE_CXX11_ABI为1,即:

      g++ -D_GLIBCXX_USE_CXX11_ABI=1 -I ...
    • 提供的build脚本仅用于编译和运行linear_parallel_demo.cpp,如需编译其他demo,需要替换“linear_parallel_demo”为对应的cpp文件名

额外说明

示例中生成的数据不代表实际场景,如需数据生成参考请查看根目录下的python用例目录: tests/apitest/opstest/python/operations/linear/

产品支持情况

本op仅支持 Atlas A2 训练系列产品/Atlas A2 推理系列产品 、 Atlas A3 训练系列产品/Atlas A3 推理系列产品 。

场景说明

提供demo分别对应,编译运行时需要对应更改build脚本:

  1. 基础场景: linear_parallel_demo.cpp
    • 默认编译脚本可编译运行
  2. 量化场景: linear_parallel_demo.cpp
    • 即更改编译脚本为:g++ -D_GLIBCXX_USE_CXX11_ABI=$cxx_abi -I "${ATB_HOME_PATH}/include" -I "${ASCEND_HOME_PATH}/include" -L "${ATB_HOME_PATH}/lib" -L "${ASCEND_HOME_PATH}/lib64" linear_parallel_demo.cpp demo_util.h -l atb -l ascendcl -o linear_parallel_demo
    • 运行时调用:./linear_parallel_demo

【免费下载链接】ascend-transformer-boost本项目是CANN提供的是一款高效、可靠的Transformer加速库,基于华为Ascend AI处理器,提供Transformer定制化场景的高性能融合算子。项目地址: https://gitcode.com/cann/ascend-transformer-boost

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/788941/

相关文章:

  • 重庆包包回收套路深!压价扣费频发?收的顶免费上门回收,真能闭眼冲? - 奢侈品回收测评
  • 如何用WPS-Zotero插件实现科研写作效率翻倍:完整指南
  • 从‘平方收敛’到‘迭代失败’:Newton法实战中的5个典型陷阱与调试指南
  • 基于明朝内阁制的AI多智能体协作系统:从架构设计到一键部署实战
  • WaveTools:面向《鸣潮》PC玩家的技术赋能工具箱
  • 每一台培养箱都精工制造,实了个验集团生产解析 - 实了个验
  • 如何一键实现多平台直播同步?OBS多路推流插件完全指南
  • 告别‘测速不准’!用iperf3在Windows/Linux/Arm上精准测试TCP带宽的保姆级教程
  • 2026年实测10款降AI率工具:免费付费全对比,毕业论文降低ai率必备 - 降AI实验室
  • UVa 191 Intersection
  • 实战AI智能体技能库:设计、Telegram连接、多智能体协同与知识库部署
  • 不止看波形!用Vivado ILA抓取FPGA上电时序与异常复位(附触发设置技巧)
  • ChatGpt-Pro项目解析:从零构建企业级AI对话应用的技术实践
  • 别再死磕手册了!手把手教你用Vivado里的10G Ethernet MAC IP核(附仿真避坑指南)
  • OpenCore Legacy Patcher:让你的老旧Mac免费升级最新macOS的终极指南
  • 3分钟彻底搞定Figma汉化!设计师专属中文界面插件指南
  • AMD Ryzen终极调试指南:SMUDebugTool解锁处理器隐藏潜力
  • 2026济南名牌手表回收高价秘籍|靠谱门店盘点,变现更省心 - 奢侈品回收测评
  • 别再手动复制路径了!Win10下EVE-NG一键关联Wireshark的保姆级配置指南
  • GTX 1050 Ti + Win10 环境下的 PyTorch-GPU 一站式部署指南
  • AMD Ryzen处理器深度调优指南:使用SMUDebugTool解锁底层性能控制
  • UVa 192 Synchronous Design
  • BetterNCM Installer:3步搞定网易云音乐插件安装,告别手动操作烦恼
  • 百度网盘提取码智能获取工具:3秒破解资源密码的终极指南
  • 用Python和树莓派GPIO玩转DHT11:手把手教你读懂单总线通信时序图
  • AI+与+AI的关键之处
  • 别让自举电路‘举’不起来:深入IR2104数据手册,搞懂H桥高端驱动的门道
  • SAP PS模块实战:如何把固定资产折旧费精准归集到项目WBS上(ACSET配置详解)
  • Source Han Serif CN字体深度应用指南:从技术原理到专业排版实践
  • 微信小程序集成ChatGPT:自部署AI助手实战指南