当前位置: 首页 > news >正文

CANN ascend-transformer-boost aclnn与ATB算子混搭示例

aclnnPluginOperation与ATBOperation混搭组图示例

【免费下载链接】ascend-transformer-boost本项目是CANN提供的是一款高效、可靠的Transformer加速库,基于华为Ascend AI处理器,提供Transformer定制化场景的高性能融合算子。项目地址: https://gitcode.com/cann/ascend-transformer-boost

介绍

本用例为aclnnPluginOperation与ATBOperation混搭组图的运行示例,该用例整体分为五个部分:aclnn算子部分、ATB算子部分、model部分、基础设施部分、主函数。

  • aclnn算子部分:实现了aclnn算子对ATB的接入。
  • ATB算子部分:使用ATB原生算子构建了一个ATB图算子。
  • model部分:主要使用了ATB算子部分与aclnn算子部分生成的算子构建了一个更大的图算子,并且包含ATB图算子相关的调用逻辑。
  • 基础设施部分:主要包含日志与内存池,用于辅助问题定位及加快显存分配速度。
  • 主函数部分:承载着程序入口的功能,同时多线程功能也在主函数中实现。

用例运行

  • 进入到atb-aclnn目录下:

    cd ${用例所在目录}/atb-aclnn
  • 设置CANN环境变量(如source /usr/local/Ascend/ascend-toolkit/set_env.sh):

    source ${toolkit安装目录}/set_env.sh
  • 设置ATB环境变量(如source /usr/local/Ascend/nnal/atb/set_env.sh):

    source ${nnal安装目录}/atb/set_env.sh
  • 执行build.sh脚本:

    bash ./build.sh
  • 执行用例:

    ./build/test_model

说明

  • 当前用例根据物理机上的device卡数创建线程,若需要调整线程个数,请自行修改main.cpp中的线程创建个数。

  • 保证demo的ABI版本与ATB一致。ATB的abi版本的查看方法:

    env | grep ATB_HOME_PATH

    demo的ABI版本查看方法:通过查看CMakeList中的如下命令来查看ABI版本为0或1,OFF表示0,ON表示1。下面的代码则表示ABI版本为0。

    option(USE_CXX11_ABI "USE_CXX11_ABI" OFF)

【免费下载链接】ascend-transformer-boost本项目是CANN提供的是一款高效、可靠的Transformer加速库,基于华为Ascend AI处理器,提供Transformer定制化场景的高性能融合算子。项目地址: https://gitcode.com/cann/ascend-transformer-boost

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/784493/

相关文章:

  • 第三代社保卡全功能使用指南
  • 从预测到响应:构建基于状态识别的量化交易系统
  • CANN/tensorflow指数更新损失缩放管理器构造函数
  • 别再浪费存储了!手把手教你用vmkfstools回收ESXi虚拟机瘦磁盘空间
  • AI驱动优化算法选择与设计:从元学习到自动化求解
  • 追赶行业节奏!DeepSeek计划6月推V4.1,500亿融资加速商业化转型
  • ACAI平台:基于数据湖与智能调度的MLOps实验管理实践
  • 构式语法与AI融合:提升NLP模型语言理解与生成能力
  • 被文档格式逼疯?Beeparser搭配PandaWiki,导入再也不用手动调
  • 避开这个坑!文件上传(MultipartFile)和普通请求Body读取冲突的完整解决流程
  • 企业生成式AI治理框架实战:从战略到落地的全流程指南
  • 保姆级教程:Qwen-Image-2512-ComfyUI内置工作流怎么用?手把手教你5分钟出图
  • 农业物联网融合智能:生物信号与AI协同的精准决策实践
  • 3步搭建个人游戏串流服务器:Sunshine让你在任何设备畅玩3A大作
  • AnimateDiff高级控制:通过草图引导视频生成
  • Arm平台U-Boot网络引导与NFS根文件系统配置实战
  • ChatGPT开源项目精选:开发者必备的AI应用开发宝藏图鉴
  • 五金合金精密塑形用镍钛合金加热:大厂品质口碑好,机器耐用售后有保障 - 品牌推荐大师
  • 2026心理健康指导师考证新趋势:哪些企业最靠谱? - 新闻快传
  • CANN SIMT特性介绍
  • 南京诚信电器家具回收:栖霞二手厨具回收公司推荐 - LYL仔仔
  • 华为CANN Profiler构造函数
  • 告别手动拟音:HunyuanVideo-Foley镜像部署指南,AI自动生成同步音效
  • AI光学硬件加速:1.2Tb/s高光谱视频实时理解平台架构与实践
  • 别再傻傻分不清了!FreeRTOS事件组与任务通知的保姆级对比与实战选型指南
  • 分布式追踪深度解析:解锁微服务架构的可观测性
  • RK3588 DTS避坑指南:regulator-always-on和regulator-boot-on到底该怎么用?别让你的板子开机就掉电
  • 基于YOLO与FaceNet的牛只鼻纹识别:从度量学习到精准畜牧实践
  • 比OpenClaw更安全的金融级安全标准工具推荐:支持内网隔离环境的国产平替厂商 - 品牌2026
  • 科研影响力评估:从引文指标到AI预测的量化方法与实践