当前位置: 首页 > news >正文

CANN Triton NPU推理后端

Resnet example 运行教程

【免费下载链接】triton-inference-server-ge-backendge-backend基于triton inference server框架实现对接NPU生态,快速实现传统CV\NLP等模型的服务化。项目地址: https://gitcode.com/cann/triton-inference-server-ge-backend

模型准备

从网站下载onnx文件: https://media.githubusercontent.com/media/onnx/models/refs/heads/main/validated/vision/classification/resnet/model/resnet18-v1-7.onnx?download=true

在example/resnet 文件夹下创建名称为 "1" 的文件夹,并将下载的onnx文件放置此文件夹中。最终目录结构如下:

example └── resnet ├── 1 │ └── resnet18-v1-7.onnx └── config.pbtxt

运行推理服务

尝试运行triton inference server:(建议使用AscendHub中的镜像直接运行)

/opt/tritonserver/bin/tritonserver --model-repository {/path/to/example}

启动完成后,在输出中可看到相应的 http端口信息。

I0301 14:17:48.002634 11040 grpc_server.cc:2519] Started GRPCInferenceService at 0.0.0.0:8001 I0301 14:17:48.002913 11040 http_server.cc:4637] Started HTTPService at 0.0.0.0:8000 I0301 14:17:48.044199 11040 http_server.cc:320] Started Metrics Service at 0.0.0.0:8002

服务端调用测试

通过调用client.py 进行测试:

cd example python client.py

执行成功后打印如下:

resnetv24_dense0_fwd shape (1, 1000) resnetv24_dense0_fwd data [[-1.4480009 -0.14706227 0.71502316 0.60883063 1.0058776 1.0106554 1.0276837 -0.89346164 -0.9704908 -0.7546704 -0.4772439 0.57412636 -0.39269644 0.37755248 -0.4234915 -0.51555425 -1.4987887 -1.698892 ...

【免费下载链接】triton-inference-server-ge-backendge-backend基于triton inference server框架实现对接NPU生态,快速实现传统CV\NLP等模型的服务化。项目地址: https://gitcode.com/cann/triton-inference-server-ge-backend

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/784198/

相关文章:

  • AI赋能数字孪生安全:从威胁检测到主动防御的实战解析
  • CANN/AMCT线性量化训练API文档
  • AI与经济学交叉研究:文献计量分析揭示范式革命与前沿趋势
  • 冀暖甄选,品质随行——河北地源热泵优选品牌伯朗宁(BROWNING) - 速递信息
  • 边开发AI Agent边学习:容器化开发与部署全指南
  • 3分钟让你的Windows右键菜单变得清爽高效:ContextMenuManager使用全攻略
  • 使用Taotoken后API调用延迟与用量可视化的实际体验
  • SALE框架:基于拍卖机制的异构LLM任务分配优化
  • AI驱动城市碳排放报告成熟度模型:从数据治理到智能决策
  • IP6525S 最大输出 22.5W,集成快充输出协议(DCP/QC2.0/QC3.0/FCP/AFC/SFCP/MTK/SCP/VOOC)的降压 SOC
  • 从PageHelper切换到Mybatis-Plus分页插件,我踩了这些‘多表查询’的坑(附完整迁移对比)
  • CANN pi0机器人VLA大模型昇腾推理指南
  • zabbix去除监控项默认返回的字符
  • CANN/sip BLAS Iamax函数文档
  • Swift测试技能库:模块化设计、异步测试与SwiftUI集成实践
  • CTP-API实战避坑:用Python处理报单与成交回报的顺序问题(附完整代码)
  • 2026年昆明代理记账与企业财税服务深度横评|云南工商变更一站式解决方案 - 年度推荐企业名录
  • 保姆级教程:用Python 3.9和OpenXLab CLI/SDK下载AI数据集(附ImageNet-21k实战)
  • AI搜索引流排行榜|2026实测盘点,做AI引流必参考 - FaiscoJeff
  • Argo CD实战指南:基于GitOps的Kubernetes持续交付核心原理与生产级部署
  • 达梦常见问题2
  • AI驱动的物联网数据质量评估与增强:从原理到工程实践
  • IP6537 集成 Type-C PD3.0(PPS)等 14 种快充协议的降压 SoC
  • 选对仪器事半功倍 日立原子吸收仪领跑工业检测 - 博客万
  • 2026年收纳整理家居神器京东代运营十大品牌专业深度测评与排名前五权威发布 - 电商资讯
  • 2026年数据经营分析平台选型,智慧大脑企业推荐合集 - 讯息观点
  • 别再只盯着NFC卡了!聊聊CCC数字钥匙里那个关键的‘身份证’——AID
  • 别再让浮点运算拖慢你的STM32F4!手把手教你开启M4内核的FPU并配置CMSIS-DSP库
  • Claude API 频繁报 529 overloaded_error 怎么解决?(踩坑3天的真实记录)
  • 2026年西北印刷行业深度横评:西安画册印刷厂、台历挂历与广告扇定制一站式解决方案 - 企业名录优选推荐