当前位置: 首页 > news >正文

CANN/ascend-transformer-boost多潜在注意力算子演示

加速库MultiLatentAttentionOperation C++ Demo

【免费下载链接】ascend-transformer-boost本项目是CANN提供的是一款高效、可靠的Transformer加速库,基于华为Ascend AI处理器,提供Transformer定制化场景的高性能融合算子。项目地址: https://gitcode.com/cann/ascend-transformer-boost

介绍

该目录下为加速库MultiLatentAttentionOperation C++调用示例。

使用说明

  • 首先source 对应的CANN和nnal包的安装路径

    1. source [cann安装路径]/set_env.sh 默认:source /usr/local/Ascend/ascend-toolkit/set_env.sh
    2. source [nnal安装路径]/set_env.sh
      默认:source /usr/local/Ascend/nnal/atb/set_env.sh
      ①. 如果使用加速库源码编译,source [加速库源码路径]/output/atb/set_env.sh
      例如: source ./ascend-transformer-boost/output/atb/set_env.sh
  • 运行demo

    bash build.sh

    注意

    • 使用cxx_abi=0(默认)时,设置D_GLIBCXX_USE_CXX11_ABI为0,即:

      g++ -D_GLIBCXX_USE_CXX11_ABI=0 -I ...
    • 使用cxx_abi=1时,更改D_GLIBCXX_USE_CXX11_ABI为1,即:

      g++ -D_GLIBCXX_USE_CXX11_ABI=1 -I ...
    • 提供的build脚本仅用于编译和运行mlapa_demo.cpp,如需编译其他demo,需要替换“mlapa_demo”为对应的cpp文件名

额外说明

示例中生成的数据不代表实际场景,如需数据生成参考请查看根目录下的python用例目录: tests/apitest/opstest/python/operations/multi_latent_attention/

场景说明

该算子所给demo仅支持在Atlas A2/A3系列产品上运行,demo的场景说明如下:

  • mlapa_demo.cpp

    参数设置

    成员名称取值
    headNum128
    qkScale1/sqrt(576)
    kvHeadNum1
    maskTypeUNDEFINED
    calcTypeCALC_TYPE_UNDEFINED
    cacheModeINT8_NZCACHE

    注意:qkScale设置值为MLA做rope投影前的headSize,即512(原始) + 64(投影) = 576

    数据规格

    tensor名字数据类型数据格式维度信息cpu/npu
    qNopeint8nd[4, 128, 512]npu
    qRopefloat16nd[4, 128, 64]npu
    ctKVint8nz[48, 16, 128, 32]npu
    kRopefloat16nz[48, 4, 128, 16]npu
    blockTablesint32nd[4, 12]npu
    contextLensint32nd[4]cpu
    qkDescalefloatnd[128]npu
    pvDescalefloatnd[128]npu
    attenOutfloat16nd[4, 128, 512]npu
  • mlapa_ds_demo.cpp

    参数设置

    成员名称取值
    headNum128
    qkScale0.1352667747812271
    kvHeadNum1
    maskTypeUNDEFINED
    calcTypeCALC_TYPE_UNDEFINED
    cacheModeKROPE_CTKV

    数据规格

    tensor名字数据类型数据格式维度信息cpu/npu
    qNopefloat16nd[32, 128, 512]npu
    qRopefloat16nd[7168, 128, 64]npu
    ctKVfloat16nd[160, 128, 1, 512]npu
    kRopefloat16nd[160, 128, 1, 64]npu
    blockTablesint32nd[32, 5]npu
    contextLensint32nd[32]cpu
    attenOutfloat16nd[32, 128, 512]npu

【免费下载链接】ascend-transformer-boost本项目是CANN提供的是一款高效、可靠的Transformer加速库,基于华为Ascend AI处理器,提供Transformer定制化场景的高性能融合算子。项目地址: https://gitcode.com/cann/ascend-transformer-boost

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/782995/

相关文章:

  • 怎样高效使用网盘直链下载助手:实用技巧完整指南
  • CANN/pto-isa轴归约与扩展操作
  • 2026年4月水蜡实力厂家如何选,高压洗车机/全自动智能洗车设备/全自动高压洗车机/无接触洗车机,水蜡制造企业推荐 - 品牌推荐师
  • “9秒删库”事件刷屏!AI是凶手,但枪是你自己递的
  • HarmonyOS 6 ArkUI 粒子动画(Particle)动态发射器控制使用文档
  • MRAM技术解析:非易失性存储器的原理与应用
  • CANN/asc-devkit内存分配API文档
  • CANN/AMCT Quantile量化
  • Hermes Agent工具链接入Taotoken聚合API的配置指南
  • GE图引擎资源变更通知API
  • 美团大模型二面:你的RAG知识库更新策略是怎样的?
  • CANN/ops-cv一维上采样反向算子
  • CANN电力仿真张量求和优化
  • 2026年4月市面上靠谱的铁氟龙排线厂商推荐,柔软度好,方便施工操作 - 品牌推荐师
  • 电液控制装置控制器4K型护套连接器
  • 企业如何利用Taotoken统一管理多个AI模型API密钥与用量
  • CANN框架适配SIG
  • 自贡智能家居装修预算怎么控制?悦阳装饰全案整装透明报价体系解析 - 优质企业观察收录
  • cann/catlass Ascend950全解量化矩阵乘
  • 电子元器件焊接调试实战经验总结
  • Switch大气层系统深度配置:从零构建你的个性化游戏环境
  • 求推荐芜湖靠谱的装修公司?来看我的真实体验
  • CANN/metadef获取算子属性值接口
  • 2026自贡装修公司全案对标:从毛坯到拎包入住的一站式整装避坑指南 - 优质企业观察收录
  • 【研报 A104】AI康养深度研究报告:从辅助诊疗,到全周期照护操作系统
  • 如何借助Taotoken用量看板精准分析并优化团队的AI调用成本
  • AI医疗实战:构建鲁棒性青光眼筛查模型的多任务学习与部署策略
  • CANN算子测试总决赛
  • CANN/HCOMM线程读取归约操作
  • CANN Add算子Kernel执行样例