当前位置: 首页 > news >正文

CANN/ATVC ACLNN调用示例

AclNNInvocationNaive工程样例

【免费下载链接】atvcATVC(Ascend C Templates for Vector Compute),是为基于Ascend C开发的典型Vector算子封装的一系列模板头文件的集合,可帮助用户快速开发典型Vector算子。项目地址: https://gitcode.com/cann/atvc

概述

本样例相比于AclNNInvocation样例工程,简化了工程配置。

目录结构介绍

├── AclNNInvocationNaive │ ├── CMakeLists.txt // 编译规则文件 │ ├── main.cpp // 单算子调用应用的入口 │ └── run.sh // 编译运行算子的脚本

代码实现介绍

完成自定义算子的开发部署后,可以通过单算子调用的方式来验证单算子的功能。main.cpp代码为单算子API执行方式。单算子API执行是基于C语言的API执行算子,无需提供单算子描述文件进行离线模型的转换,直接调用单算子API接口。

自定义算子编译部署后,会自动生成单算子API,可以直接在应用程序中调用。算子API的形式一般定义为“两段式接口”,形如:

// 获取算子使用的workspace空间大小 aclnnStatus aclnnAddCustomGetWorkspaceSize(const aclTensor *x, const aclTensor *y, const aclTensor *out, uint64_t *workspaceSize, aclOpExecutor **executor); // 执行算子 aclnnStatus aclnnAddCustom(void *workspace, int64_t workspaceSize, aclOpExecutor *executor, aclrtStream stream);

其中aclnnAddCustomGetWorkspaceSize为第一段接口,主要用于计算本次API调用计算过程中需要多少的workspace内存。获取到本次API计算需要的workspace大小之后,开发者按照workspaceSize大小申请Device侧内存,然后调用第二段接口aclnnAddCustom执行计算。具体参考单算子API调用章节。

运行样例算子

1. 编译算子工程

运行此样例前,请参考编译算子工程完成前期准备。

2. aclnn调用样例运行

  • 进入到样例目录
    以命令行方式下载样例代码,master分支为例。

    cd atvc/examples/ops_aclnn/add/AclNNInvocationNaive
  • 样例编译文件修改

    将CMakeLists.txt文件内"/usr/local/Ascend/ascend-toolkit/latest"替换为CANN软件包安装后的实际路径。
    eg:/home/HwHiAiUser/Ascend/ascend-toolkit/latest

  • 样例执行

    用户参考run.sh脚本进行编译与运行。

    bash run.sh

【免费下载链接】atvcATVC(Ascend C Templates for Vector Compute),是为基于Ascend C开发的典型Vector算子封装的一系列模板头文件的集合,可帮助用户快速开发典型Vector算子。项目地址: https://gitcode.com/cann/atvc

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/784802/

相关文章:

  • 从SPI到8080:一文搞懂MIPI DBI(Type C)如何驱动你的LCD屏并优化帧率
  • CANN/AMCT KV-Cache量化模型创建
  • 乡村全科执业医师培训机构哪个好?这份2026最新调研报告告诉你 - 医考机构品牌测评专家
  • RT2.0 动态 Shape 执行器特性分析
  • 从“算力竞赛”到“业务落地”:AI营销一体机选型的几点思考
  • Java老兵转型AI开发实战指南:收藏这份从零到精通的学习路线,小白也能快速上手大模型
  • 2026年4月靠谱的通风蝶阀厂家推荐,电动组合风阀/岗位轴流风机/吊顶式空调机组/通风蝶阀,通风蝶阀门店找哪家 - 品牌推荐师
  • 避坑指南:在CentOS7上为TensorFlow2.6搭建Python3.8环境,我踩过的那些‘依赖’雷
  • Swift-All实战:用T4显卡微调7B大模型,一小时成本不到5块钱
  • 深度学习赋能医学影像:COVID-19检测与病灶分割技术全解析
  • 淘金币自动化脚本终极指南:如何每天5分钟完成淘宝全任务
  • 2025届毕业生推荐的五大降AI率工具横评
  • 高校研究小组如何借助Taotoken低成本使用多种大模型进行实验
  • CANN推理优化实践:Kimi-K2-Thinking
  • 连云港本地CPPM官方授权报名中心及联系方式 - 众智商学院课程中心
  • CANN/ge Profiling特性介绍
  • 从Transformer到对齐:大语言模型完整技术栈与实战解析
  • 搞定OpenWrt下Sane移动端扫描的‘最后一公里’:一个Go程序的编译与部署实战
  • CANN驱动设备兼容查询
  • 大模型部署的社会风险与三层治理框架:从技术可控到社会可信
  • AI安全实战:从内容溯源到红队演练构建可信AI系统
  • 5分钟让小爱音箱变身AI语音助手:MiGPT完整指南
  • 面试官最爱问的同步FIFO细节:空满信号用组合逻辑还是时序逻辑?实战避坑指南
  • 唐山本地CPPM官方授权报名中心及联系方式 - 众智商学院课程中心
  • 黄仁勋:中国不仅有“鬼数据中心”,还有庞大的能源、芯片、AI人才优势
  • CANN/metadef数值兼容性检查
  • 还在手动逐句转写录音提取文字?2026年亲测这4款AI工具,10分钟搞定2小时录音
  • 2026苏州太阳能电池板回收公司推荐榜,正规企业优选 - 企业推荐师
  • 基于MFDFA、传递熵与Kuramoto模型的EEG信号特征工程实践
  • 湖州本地CPPM官方授权报名中心及联系方式 - 众智商学院课程中心