当前位置：首页 > news >正文

【YOLOv11】015、YOLOv11模型部署：使用ONNX Runtime进行CPU/GPU推理

news 2026/4/15 18:22:05

昨天深夜，隔壁组的同事跑过来问我：“模型在PyTorch里跑得好好的，导出ONNX后推理速度反而慢了，这正常吗？” 我看了眼他的代码，发现他直接把模型丢给ONNX Runtime，连最基本的session配置都没做。这问题太典型了，今天咱们就聊聊YOLOv11的ONNX Runtime部署，那些容易踩坑的细节。

从PyTorch到ONNX：别急着export

很多人拿到训练好的YOLOv11模型，第一反应就是直接torch.onnx.export。先等等，导出前得确保模型处于推理模式：

model.eval()# 这个不能忘model.to('cpu')# 导出时最好在CPU上#

查看全文

http://www.jsqmd.com/news/646020/

Python 类型提示：从基础到高级

# WebTransport：下一代低延迟实时通信的编程语言实践与创新应用在现代Web开发中，**实时性**和**高效性**已经成为衡量

抖音合集智能解析引擎：如何实现大规模视频内容的自动化批量处理

从‘no route to host’到‘i/o timeout’：一文读懂kubectl连接失败的常见坑与避坑指南

检验计划软件哪个好？深度对比检验计划软件哪家正规与实战评测

FPGA调试利器：Vivado ILA采样深度设1024就够？实测对比不同深度对编译时间和资源的影响

保姆级教程：手把手教你用Visual Studio 2022编译Fluent与EDEM 2024耦合器（附资源获取）

从Vulkan到SAPIEN再到RobotWin：一个云上机器人仿真环境的完整排错日志

Claude Mythos Preview 来了：Anthropic 网络安全专用大模型在 Amazon Bedrock 上开放申请，代码审计要变天了

别再手动改路径了！用Python脚本一键清洗你的Ultralytics YAML数据集配置文件

如何快速将网页小说转换为电子书：WebToEpub完整指南

支持多语种的知识竞赛软件有哪些？

DPO微调总让模型‘信心不足’？ICLR 2025这篇论文教你一个SFT阶段的小改动，轻松缓解‘挤压效应’

从UI设计稿到代码实现：用QSS精准还原带“部分选中”状态的复杂CheckBox设计

行驶车辆状态估计，无迹卡尔曼滤波，扩展卡尔曼滤波（EKF/UKF）软件使用：Matlab/S...

SeuratWrappers终极指南：3步解锁单细胞分析扩展工具集

微信聊天记录永久保存指南：让珍贵对话不再丢失

ROS1新手避坑：Ubuntu 20.04下rviz闪退（exit code -11）的终极解决与文件夹玄学

ASMR下载终极指南：如何用asmr-downloader轻松获取asmr.one资源

从Wireshark抓包到FTP搭建：TCP/IP实验全流程避坑指南（含IIS/FileZilla对比）

从家庭WiFi到5G语音：手把手拆解VoWiFi（WiFi通话）的三种接入方式与安全机制

FFmpeg实战：如何用命令行快速预览YUV文件（附常见格式参数详解）

网卡高级设置优化指南：提升网络性能与稳定性

MusePublic艺术创作引擎PS下载安装：艺术后期处理

终极指南：memtest_vulkan - 免费开源显存稳定性测试工具，告别显卡故障

医疗器械生产工艺流程图的注意事项

告别虚拟机！在Win10/11上给Ubuntu 20.04分个家，手把手部署ego_planner无人机规划器

CAN FD项目实战：在CANoe中为混合网络（CAN/CAN FD）正确配置DBC数据库

实战指南：基于KuGouMusicApi构建专业级音乐应用服务

HFSS 19 实战：手把手教你仿真SMA接头与微带分支的匹配问题（附模型文件）

从PyTorch到ONNX：别急着export

相关文章：