当前位置: 首页 > news >正文

CANN/ge DataFlow简介

DataFlow简介

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

读者对象

本文档用于指导开发者如何使用DataFlow接口进行计算图的构建、修改、编译和执行。通过本文档您可以达成以下目标:

  • 了解通过FlowOperator构建FlowGraph的方法。
  • 掌握编译运行FlowGraph的方法。
  • 了解UDF开发过程及相关接口。

熟悉CANN软件基本架构以及特性、具备C++/C语言程序开发能力,对机器学习、深度学习有一定了解的人员,可以更好地理解本文档。

DataFlow概述

DataFlow用于描述采用数据队列以数据驱动方式将一个或多个计算处理点(ProcessPoint)组织成完整的计算流。ProcessPoint与算子的关键区别是采用异步方式处理。DataFlow通过FlowGraph来承载,ProcessPoint通过FlowNode来承载,各个接口之间的关系如下所示。

图1DataFlow相关接口之间的关系 ![](https://raw.gitcode.com/cann/ge/raw/90b6b5f955453823e2ca13bfd6ecc1d7b12bb375/docs/zh/user_guides/dflow/dflow_dev/cpp/figures/DataFlow相关接口之间的关系.png "DataFlow相关接口之间的关系"?utm_source=gitcode_repo_files)

  • FlowGraph:DataFlow的Graph,由输入节点FlowData和计算节点FlowNode构成。
  • FlowOperator:是FlowGraph的节点基类,衍生类有FlowData和FlowNode两种类型。
  • FlowData:FlowGraph的输入节点。
  • FlowNode:FlowGraph的计算节点。支持如下两种类型。
    • FunctionPp:Function的计算处理点,通过UDF(User Defined Function)实现用户自定义功能。
    • GraphPp:Graph的计算处理点,通过IR构图实现用户的计算逻辑。

DataFlow支持用户通过FunctionPp和GraphPp编写自定义处理函数,通过DataFlow构图以FlowModel的方式运行。

DataFlow和IR构图的不同点如下所示。

表1DataFlow和IR构图比较

|维度|IR构图|DataFlow| |--|--|--| |数据流处理方式|- 图只支持一次输入对应一次输出。
- 图中的算子之间采用同步数据流,用于表达串行,同步执行。|- DataFlow支持一次输入对应多次输出,或者一次输入对应一次输出,或者多次输入对应一次输出。灵活性更高。
-DataFlow中的ProcessPoint采用异步数据流,可以表达并行,异步执行,充分利用资源,提升吞吐量。| |自定义功能开发方式|通过开发自定义算子实现。
算子包括算子原型定义、算子代码实现、算子信息库定义、算子适配等过程,需要用户开发的交付件多,使用门槛相对较高。|可以通过开发UDF实现,也可以通过开发自定义算子实现。
UDF开发只需要定义用户函数,构建图。用户交付件少,使用门槛低。| |内存分配方式|算子的输入内存、输出内存是已经申请好的。|UDF输出内存是用户自定义的,需要用户自己申请。|

整体开发流程

约束

无论是在host侧还是device侧,模型对输入数据都不能进行修改。

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/1120096/

相关文章:

  • React Native离线应用开发:Offix SQLite存储与网络适配教程
  • LoadingLayout自定义样式指南:打造专属的Android加载动画和空状态页面
  • 零基础掌握Django与Flask:nwpu-cram中的Web框架实践指南
  • HookLib²高级应用:线程上下文修复与指令重定位技术
  • 如何快速上手归藏提示词库:新手入门终极教程
  • ReScript genType 开发者指南:贡献代码与维护项目的完整流程
  • XStream高级技巧:自定义转换器与别名系统深度解析
  • opmsg常见问题解决:从编译错误到使用问题的完整排错指南
  • AzaharPlus:终极3DS模拟器增强版,带来超越原版的游戏体验 [特殊字符]
  • SQL字符串函数大全:SQL Ultimate Course文本处理终极指南
  • 如何快速上手Offix:从零开始构建离线优先的GraphQL应用
  • 响应式设计资源:Instatic断点设置与设备配置完全指南
  • 空白期8个月,从40投2面试到2周拿offer——一个案例讲透AI简历工具怎么选
  • 微信聊天记录永久保存:从数据丢失到数字遗产的完整解决方案
  • LoadingLayout主题与样式配置:XML和代码两种方式详细教程
  • 电气工程与电机驱动核心技术解析
  • FPDF入门教程:5分钟创建你的第一个PHP PDF文档
  • Juggl插件架构解析:深入理解Obsidian插件开发的核心机制
  • nginx-auth-ldap安全加固:SSL配置与证书验证的正确姿势
  • Primer设计系统未来发展趋势:设计系统演进路线图与社区规划
  • Gloom的Markdown渲染引擎:移动端Markdown显示优化策略
  • Windmill React UI响应式设计指南:适配所有设备的界面开发技巧
  • GitHub API在Gloom中的应用:如何高效集成第三方API服务
  • 对抗性鲁棒性研究:MNIST挑战背后的学术意义与实现
  • CANN/GE ES API生成工具CMake指南
  • WTN6系列语音芯片在智能电饭煲中的播报方案
  • GFile vs 传统文件传输:为什么WebRTC是未来的选择
  • Primer设计系统新手教程:从零开始构建GitHub风格界面
  • Xous输入法引擎IME:多语言输入支持的架构设计
  • 2026年证书自动化选型指南:从ACME到零信任的完整路线图