当前位置: 首页 > news >正文

CANN/ge:文件队列加载模型API

aclmdlLoadFromFileWithQ

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

产品支持情况

产品

是否支持

Atlas A3 训练系列产品 / Atlas A3 推理系列产品

Atlas A2 训练系列产品 / Atlas A2 推理系列产品

功能说明

从文件加载离线模型数据,模型的输入、输出数据都存放在队列中。本接口只支持加载固定Shape输入的模型。

本接口中通过modelPath参数传入的文件是适配昇腾AI处理器的离线模型,即*.om文件。关于如何获取om文件,请参见《ATC离线模型编译工具用户指南》

若对om模型文件大小有限制,本接口还支持加载外置权重文件,但需在构建模型时,将权重保存在单独的文件中。例如在使用ATC工具生成om文件时,将--external_weight参数设置为1(1表示将原始网络中的Const/Constant节点的权重保存在单独的文件中),且该文件保存在与om文件同级的weight目录下),那么在使用本接口加载om文件时,需将weight目录与om文件放在同级目录下,这时本接口会自行到weight目录下查找权重文件,否则可能会导致单独的权重文件加载不成功。

函数原型

aclError aclmdlLoadFromFileWithQ(const char *modelPath, uint32_t *modelId, const uint32_t *inputQ, size_t inputQNum, const uint32_t *outputQ, size_t outputQNum)

参数说明

参数名

输入/输出

说明

modelPath

输入

模型文件路径的指针,路径中包含文件名。运行程序(APP)的用户需要对该存储路径有访问权限。

modelId

输出

模型ID的指针。

系统成功加载模型后,返回模型ID作为后续操作时识别模型的标志。

inputQ

输入

队列ID的指针,一个模型的输入对应一个队列ID。

inputQNum

输入

输入队列大小。

outputQ

输入

队列ID的指针,一个模型的输出对应一个队列ID。

outputQNum

输入

输出队列大小。

返回值说明

返回0表示成功,返回其他值表示失败,请参见aclError。

约束说明

模型加载、模型执行、模型卸载的操作必须在同一个Context下(关于Context的创建请参见aclrtSetDevice或aclrtCreateContext)。在加载前,请先根据模型文件的大小评估内存空间是否足够,内存空间不足,会导致应用程序异常。

参考资源

当前还提供了aclmdlSetConfigOpt接口、aclmdlLoadWithConfig接口来实现模型加载,通过配置对象中的属性来区分,在加载模型时是从文件加载,还是从内存加载,以及内存是由系统内部管理,还是由用户管理。

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/1051330/

相关文章:

  • Gaussian Splatting(高斯泼溅)技术原理与应用详解:下一代3D重建技术来了
  • ARM7TDMI-S微控制器ISP/IAP编程与JTAG调试实战指南
  • 构建企业级AI推理平台:vLLM架构设计与生产部署指南
  • 嵌入式GUI显示驱动配置指南:以emWin的GUIDRV_CompactColor_16为例
  • Developer-Portfolio SEO 优化指南:10个技巧让你的作品集在 Google 排名更高 [特殊字符]
  • 嵌入式GUI位图转换实战:从格式选择到性能优化全解析
  • 深入解析后端技术栈:构建高性能Web应用的关键
  • 5个AI技能让你的Obsidian笔记效率提升300%
  • 零成本离线AI代码助手:Qwen2.5-Coder+Ollama+Chatbox实战搭建
  • 成都做净化车间装修的公司哪家好?教你筛选靠谱净化装修服务商 - 洁净室推广助手
  • CANN/ge ACL操作属性设置接口
  • 金融数据处理实战:QuantFinanceBook中的MarketData模块应用
  • ARM Cortex-M4开发实战:TWR-K40X256硬件解析与嵌入式系统设计
  • Python中绘制R的科研级可视化图
  • 8大网盘直链解析:免费下载加速工具的终极解决方案
  • AISMM模型:构建AI驱动的可自证合规与风险管理体系
  • Ascend C 文档搜索技能评估
  • 嵌入式GUI开发:emWin TREEVIEW控件从入门到实战
  • ArcReel两种内容模式对比:说书模式与剧集动画模式的创作差异
  • LTX-2文本编码器配置:Gemma 3模型集成与优化指南
  • 如何零成本打造个人专属文件转换服务器?ConvertX终极指南
  • Chain-of-Models:分阶段预训练新范式,高效构建视觉大模型
  • CANN/GE算子参数更新接口
  • React Native Avoid SoftInput未来路线图:新架构支持与功能展望
  • 2026 AI外贸获客平台功能对比:服务商的专业适配性深度分析 - 万事通达
  • 淘系店铺托管怎么选?2026 淘宝代运营综合实力榜单解读 - 羊城派
  • 华为光猫配置解密工具:快速解密XML与CFG配置文件的技术指南
  • CANN/ge图引擎aclgrph接口
  • 终极指南:如何安全备份你的Switch游戏收藏?NxDumpTool完整教程
  • Video2X终极指南:3步将低清视频无损放大到4K的AI视频增强方案