当前位置: 首页 > news >正文

CANN/GE图引擎Profiling初始化接口

aclgrphProfInit

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

产品支持情况

产品

是否支持

Atlas A3 训练系列产品 / Atlas A3 推理系列产品

Atlas A2 训练系列产品 / Atlas A2 推理系列产品

头文件/库文件

  • 头文件:#include <ge/ge_prof.h>
  • 库文件:libmsprofiler.so

功能说明

初始化Profiling,设置Profiling参数(目前供用户设置保存性能数据文件的路径)。

函数原型

Status aclgrphProfInit(const char *profiler_path, uint32_t length)

参数说明

参数名

输入/输出

说明

profiler_path

输入

指定保存性能数据的文件的路径,路径支持绝对路径和相对路径。

length

输入

profiler_path的长度,单位为字节。最大长度不超过4096字节。

返回值说明

参数名

类型

说明

-

Status

SUCCESS:成功。

FAILED:失败。

ACL_ERROR_FEATURE_UNSUPPORTED:动态Profiling场景下不支持调用aclgrphProfInit接口。

约束说明

  • 不支持多次重复调用aclgrphProfInit,并且该接口需和aclgrphProfFinalize配对使用,先调用aclgrphProfInit接口再调用aclgrphProfFinalize接口。
  • 建议该接口在GEInitialize之后,AddGraph之前被调用,可采集到AddGraph时的Profiling数据。

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/793426/

相关文章:

  • PD分离(Prefill-Decode Disaggregation)技术方案​​
  • Swift原生Ollama客户端库:简化本地大模型集成与流式对话开发
  • AI新闻链接汇总(2026-05-10)
  • CANN/asc-devkit:SetAlignSplit函数
  • 一种小型家用破壁机的设计
  • Open LLM Leaderboard背后的秘密:HuggingFace evaluation-guidebook深度揭秘
  • CANN/Ascend C调试打印API
  • 【信息科学与工程学】计算机科学与自动化——第三十一篇 半导体晶圆制造01(3)
  • CANN/asc-devkit伪量化API文档
  • YOLO26缝合Polarized Self-Attention:极化自注意力在高分辨率图像的降维打击
  • ROS学习(二)
  • 基于现代霍普菲尔德网络的AI智能体记忆方案:高速、免费、确定性的联想记忆系统
  • Protobuf笔记
  • ChameleonUltra高级应用:硬嵌套攻击与实时卡数据捕获技术
  • ARMv9 TRBMPAM_EL1寄存器配置与性能监控实战
  • AArch64外部调试架构与Debug State机制详解
  • 开源材料计算自动化平台OpenClaw:从高通量筛选到机器学习集成
  • 终极鼠标性能测试指南:5分钟快速诊断你的鼠标问题
  • DLSS Swapper终极指南:免费提升游戏性能的3个简单步骤
  • CANN/ops-math DropOutV3算子
  • BV 开发者指南:Jetpack Compose 在TV应用中的最佳实践
  • CANN/ops-nn动态量化RMS归一化融合算子
  • CANN/ops-nn AdvanceStep算子
  • CANN/GE模型内存查询接口
  • 耗时3个月整理!K12少儿编程全套学习课件,老师/家长直接用
  • ARMv9 TRBSR寄存器解析与调试实践
  • ARM TLB管理:原理、指令与优化实践
  • 本地化AI代码助手Copaw:设计原理与工程实践指南
  • ContextPilot:优化KV缓存复用,加速RAG与长上下文推理
  • Arm CoreSight SoC-400调试架构与寄存器编程详解