当前位置: 首页 > news >正文

CANN/ge:昇腾图引擎GE

GE(Graph Engine 图引擎)

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

🔥 Latest News

  • [2026/03] 持续增强图优化能力,完善单元测试覆盖,修复多个边缘场景的编译问题;优化文档结构,提升开发者体验。
  • [2026/02] 优化自动融合与广播场景支持,新增 BF16 数据类型支持;增强 HostCPU 引擎能力,优化 session 创建销毁锁机制;修复外置权重、线程加载等场景下的 bug;支持 Reduce 分核轴 Store 地址冲突惩罚,提升算子融合效果。
  • [2026/01] GE 项目首次上线,开源图编译器和执行器,支持 PyTorch、TensorFlow 前端接入以及 ONNX、PB 模型格式解析与编译。

🚀 概述

GE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。详见昇腾社区文档-图模式开发指南。

⚡️ 快速入门

若希望快速体验 GE 的工作方式及基本开发流程,可参考以下文档:

  • 构建验证:介绍组件的完整构建、测试样例运行流程。
  • 快速开始:以 ResNet50 模型为例,介绍如何使用 ATC 工具进行模型转换,并在昇腾 AI 处理器上执行推理。
  • 快速开始-LLM:以 Qwen 模型为例,介绍如何使用 ATC 工具进行LLM模型转换,并实现LLM模型的加载、执行和获取执行结果等。

📚 文档

如需了解如何使用 GE 进行模型编译与执行,可参见图模式开发指南、技术文章等内容: GE 参考资料

如果希望深入了解 GE 的内部设计、架构机制与开发流程,可参考以下文档:

  • GE 架构说明文档:介绍核心组件、执行流程、优化机制等内部原理。
  • 贡献指南:说明如何提交 Issue、Pull Request 以及代码规范。
  • AI Agent支持:介绍仓内默认使用的一些skills及使用agent辅助开发流程

🌐 生态集成

以下项目已集成 GE 作为推理或图模式后端:

  • TorchAir:将 GE 接入 PyTorch 图模式。链接
  • TFA(TensorFlow Adapter):将 GE 作为 TensorFlow 后端。链接
  • JittorInfer:基于昇腾芯片的大模型 C++ 推理框架。链接
  • Triton GE Backend:GE 的 Triton Inference Server 后端。链接

说明:上述列表为已知并对外公开的集成案例,并非完整清单。 若您正在使用 GE,欢迎通过 Issue 或 PR 补充,我们将持续更新相关信息。

📝 其他信息

  • 安全声明
  • 许可证

📝 联系我们

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/782601/

相关文章:

  • pi0机器人VLA大模型昇腾推理优化
  • 有没有想有偿帮写贪吃蛇编程大作业的(C语言)
  • CANN/hccl AllGatherV接口文档
  • Python 智能体实战:从 0 搭建模块化 Agent 路由系统,落地小龙虾门店运营助手
  • pywencai实战指南:3大场景解决金融数据抓取难题
  • 2026年深圳民办初中择校观察:规范办学提质效,华朗学校成优质选择 - 深度智识库
  • 2026年唐山外墙清洗、烟道保洁与商业保洁服务商深度评测指南 - 企业名录优选推荐
  • 还在被本科终稿 PUA?Paperxie 这波操作直接让你从秃头党变过审王
  • 关于rhel8中的authselect、nss、ipa、pam、sssd、ldap等组件的理解
  • CANN具身智能优化样例
  • MakeFile简介
  • mysql如何选择存储引擎_mysql MyISAM与InnoDB深度对比
  • 泳装出款慢?AI正在重构流程
  • 告别周期性全量:KES 块级永久增量备份设计与实现
  • 2026 年贵州全省结构加固・彩钢瓦翻新・外墙翻新优质服务商 TOP5 权威榜单 - 深度智识库
  • 近期频现“售后网络升级”公告,腕表维修行业究竟在升级什么?——亨得利官方硬核技术解码 - 亨得利腕表维修中心
  • 给 Hermes 装上显微镜:Agent 执行全知道
  • 解锁全平台直播录制:DouyinLiveRecorder让你永不错过精彩瞬间
  • CANN/asc-tools msobjdump样例
  • 终极Windows DLL注入实战指南:3步掌握Xenos高效内存注入技术
  • DS4Windows终极配置指南:深度优化PS4手柄在Windows平台的性能表现
  • Claude 智能体工程
  • Sunshine游戏串流服务器:10分钟打造您的私人游戏云平台
  • FigmaCN:打破语言壁垒,让Figma真正成为中文设计师的创作利器
  • 如何高效使用跨平台Steam创意工坊下载器:WorkshopDL完整解决方案指南
  • 2026年5月东莞卖金实时行情,三家连锁门店报价一目了然 - 李甜岚
  • 量子计算中随机化算法与资源优化技术解析
  • 2025届学术党必备的AI辅助论文神器实测分析
  • 2026年脚手架包工包料厂家推荐:南通健明模架工程有限公司,脚手架施工/承插型盘扣式脚手架厂家 - 品牌推荐官
  • NumPy 数组入门详解