当前位置：首页 > news >正文

CANN/GE动态输入算子样例

news 2026/7/6 0:14:13

样例使用指导

【免费下载链接】geGE（Graph Engine）是面向昇腾的图编译器和执行器，提供了计算图优化、多流并行、内存复用和模型下沉等技术手段，加速模型执行效率，减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力，并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

1、功能描述

本样例使用动态输入算子进行构图，旨在帮助构图开发者快速理解动态输入的定义和使用

2、目录结构

cpp/ ├── src/ | └── CMakeLists.txt // CMake构建文件 | └── es_showcase.h // 头文件 | └── make_concatv2_graph.cpp // sample文件 ├── CMakeLists.txt // CMake构建文件 ├── main.cpp // 程序主入口 ├── README.md // README文件 ├── run_sample.sh // 执行脚本 ├── utils.h // 工具文件

3、使用方法

3.1、准备cann包

通过安装指导环境准备正确安装toolkit和ops包
设置环境变量 (假设包安装在/usr/local/Ascend/)

source /usr/local/Ascend/cann/set_env.sh

3.2、编译和执行

1.2.1 生成 es 接口与构建图进行DUMP

只需运行下述命令即可完成清理、生成接口、构图和DUMP图：

bash run_sample.sh

当前 run_sample.sh 的行为是：先自动清理旧的 build，构建 sample并默认执行sample dump 。当看到如下信息，代表执行成功：

[Success] sample 执行成功，pbtxt dump 已生成在当前目录。该文件以 ge_onnx_ 开头，可以在 netron 中打开显示

1.2.2 输出文件说明

执行成功后会在当前目录生成以下文件：

ge_onnx_*.pbtxt - 图结构的protobuf文本格式，可用netron查看

1.2.3 构建图并执行

基本的图构建和dump功能外，esb_sample支持构建图并实际执行计算。

bash run_sample.sh -t sample_and_run

该命令会：

自动生成ES接口
编译sample程序
生成dump图、运行图并输出计算结果

执行成功后会看到：

[Success] sample_and_run 执行成功，pbtxt和data输出dump 已生成在当前目录

可通过data文件查看计算结果

3.3、日志打印

可执行程序执行过程中如果需要日志打印来辅助定位，可以在bash run_sample.sh之前设置如下环境变量来让日志打印到屏幕

export ASCEND_SLOG_PRINT_TO_STDOUT=1 #日志打印到屏幕 export ASCEND_GLOBAL_LOG_LEVEL=0 #日志级别为debug级别

1.4、图编译DUMP图

可执行程序执行过程中，如果需要DUMP图来辅助定位图编译流程，可以在 bash run_sample.sh -t sample_and_run 之前设置如下环境变量来DUMP图到执行路径下

export DUMP_GE_GRAPH=2

4、核心概念介绍

4.1、构图步骤如下：

创建图构建器(用于提供构图所需的上下文、工作空间及构建相关方法)
添加起始节点(起始节点指无输入依赖的节点，通常包括图的输入(如 Data 节点)和权重常量(如 Const 节点))
添加中间节点(中间节点为具有输入依赖的计算节点，通常由用户构图逻辑生成，并通过已有节点作为输入连接)
设置图输出(明确图的输出节点，作为计算结果的终点)

4.2、动态输入

概念说明：动态输入是指某些算子的输入个数不固定；例如 ConcatV2 和 AddN 算子，该算子为动态多输入算子

ConcatV2 算子的原型如下所示，ES 构图生成的API是ConcatV2()，支持在 C、C++ 中使用

REG_OP(ConcatV2) .DYNAMIC_INPUT(x, TensorType({BasicType(), DT_BOOL, DT_STRING})) .INPUT(concat_dim, TensorType::IndexNumberType()) .OUTPUT(y, TensorType({BasicType(), DT_BOOL, DT_STRING})) .ATTR(N, Int, 1) .OP_END_FACTORY_REG(ConcatV2)

其对应的函数原型为：

函数名：ConcatV2（C++）或 EsConcatV2（C）
参数：共 3 个，依次为 x， concat_dim， N
返回值：输出 y

C API中：

EsCTensorHolder *EsConcatV2(EsCTensorHolder **x， int64_t x_num, EsCTensorHolder *concat_dim, int64_t N);

C++ API：

EsTensorHolder ConcatV2(const std::vector<EsTensorHolder> &x, const EsTensorLike &concat_dim, int64_t N = 1);

注： 1.使用TensorLike类型表达输入，以支持实参可以直接传递数值的情况 2.使用默认参数表达IR原型中的可选属性

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

查看全文

http://www.jsqmd.com/news/795915/

STM32对接LD3320语音模块，除了串口你还可以试试这个‘笨’办法：GPIO直连避坑指南

从PCM到G.711a：一个电话语音编码的Windows实现踩坑实录（含FFplay验证方法）

智慧工厂与养殖场的一体化光伏监控系统方案

sdrtrunk插件开发教程：如何扩展新的协议解码功能

2026上海冷冻冷库安装公司电话推荐，高效服务快速上门 - 品牌2025

别再折腾源码编译了！Ubuntu 22.04 LTS下用apt-get一键部署Asterisk PBX（附SIP账号配置详解）

CAN Busoff快慢恢复机制详解：从AUTOSAR CANSM参数到主机厂测试需求

如何快速上手Fabric Carpet：10个必知核心功能详解

FanControl深度解析：解锁Windows风扇控制的专业级配置哲学

暗黑破坏神2终极重生：3分钟让你的经典游戏焕然一新

vs studio安装 VisualStudioSetup 开始之前 Windows Installer服务不可用。请重启系统，然后重试。

CANN/asc-devkit SetBufferLen API

CANN/GE动态输入Python构图示例

别再乱改VMware NAT网段了！桥接 vs NAT，你的开发/测试环境到底该选哪个？

2026年冷库安装电话：专业团队快速响应，打造一站式冷链解决方案 - 品牌2025

【信息系统项目管理师-论文真题】2025上半年（第二批）论文详解（包括解题思路和写作要点）

SITS2026不是标准，是生存协议：3类AI应用CI/CD架构对比（含A/B测试、RAG、Agent工作流）

【信息科学与工程学】计算机科学与自动化——第三十一篇半导体晶圆制造01

SQLite 写入锁表报错 database is locked 怎么排查解决

STK Target Sequence实战：不写一行代码，30分钟搞定卫星初始轨道参数优化

高点摄像山火烟雾检测数据集（并按照低、中详细标注烟雾浓度）。主要针对初期山火，任何野火检测系统的最重要目标是在火势扩大之前及时检测到火灾

NoFences：免费开源桌面分区工具，5分钟打造高效整洁工作空间

终极D2DX指南：让经典暗黑破坏神2在现代电脑上焕发新生

从仿真到流片：手把手教你搞定BJT温度传感器中的A、B值计算与校准

告别同义词替换！我实测了3款降AI工具，英文论文稳过Turnitin检测

保姆级教程：在Ubuntu 20.04上从零编译运行ORB-SLAM3（含Pangolin报错解决）

Vue2和Vue3创建应用对比

5分钟掌握Typora插件：从文件管理小白到高效写作达人的3步法

ARM Cortex-R7 MPCore处理器架构与实时系统设计

Ascend C SetUserTag API