当前位置：首页 > news >正文

YOLO-v5实战：用预训练模型快速检测图片中的物体

news 2026/7/28 13:42:12

YOLO-v5实战：用预训练模型快速检测图片中的物体

1. 引言：为什么选择YOLO-v5

在计算机视觉领域，物体检测是一项基础而重要的任务。YOLO（You Only Look Once）系列模型因其速度快、精度高的特点，成为工业界和学术界的热门选择。YOLO-v5作为该系列的最新版本之一，在保持高精度的同时，进一步优化了推理速度。

本文将带你快速上手YOLO-v5预训练模型，无需复杂训练过程，直接使用现成模型完成物体检测任务。通过本教程，你将学会：

如何快速部署YOLO-v5环境
如何使用预训练模型进行物体检测
如何解读检测结果并保存输出
常见问题的解决方法

2. 环境准备与快速部署

2.1 系统要求

YOLO-v5对硬件要求相对友好，可以在以下环境中运行：

操作系统：Linux/Windows/macOS
Python：3.7或更高版本
GPU：推荐NVIDIA GPU（CUDA支持），但CPU也可运行
内存：至少8GB（处理大图片时建议16GB以上）

2.2 快速安装

最简单的方式是使用CSDN星图镜像，该镜像已预装所有必要组件：

# 拉取镜像（如果使用CSDN星图服务） docker pull csdn-mirror/yolo-v5

或者通过pip安装所需依赖：

pip install torch torchvision pip install opencv-python pip install matplotlib

2.3 下载YOLO-v5代码

git clone https://github.com/ultralytics/yolov5 cd yolov5 pip install -r requirements.txt

3. 使用预训练模型进行检测

3.1 加载模型

YOLO-v5提供了多个预训练模型，大小和精度各不相同：

import torch # 可选的模型：yolov5n, yolov5s, yolov5m, yolov5l, yolov5x model = torch.hub.load('ultralytics/yolov5', 'yolov5s') # 加载最小的yolov5s模型

模型大小与性能对比：

模型	参数量	推理速度(ms)	mAP@0.5
yolov5n	1.9M	2.7	0.28
yolov5s	7.2M	3.2	0.37
yolov5m	21.2M	4.7	0.45
yolov5l	46.5M	6.3	0.49
yolov5x	86.7M	9.1	0.51

3.2 准备输入图片

YOLO-v5支持多种输入格式：

# 本地图片文件 img = 'data/images/zidane.jpg' # 图片URL img = 'https://ultralytics.com/images/zidane.jpg' # OpenCV图像 import cv2 img = cv2.imread('zidane.jpg') # PIL图像 from PIL import Image img = Image.open('zidane.jpg') # numpy数组 import numpy as np img = np.array(Image.open('zidane.jpg'))

3.3 执行推理

# 执行推理 results = model(img) # 查看结果 results.print() # 打印检测结果 results.show() # 显示检测结果

4. 结果处理与可视化

4.1 理解检测结果

YOLO-v5的检测结果包含以下信息：

边界框坐标：(x1, y1, x2, y2)格式
类别标签：如person, car, dog等
置信度分数：0-1之间的数值，表示检测可靠性

4.2 结果可视化方法

# 保存检测结果图片 results.save() # 保存到runs/detect/exp目录 # 获取Pandas格式的结果 df = results.pandas().xyxy[0] print(df) # 获取JSON格式的结果 json_results = results.pandas().xyxy[0].to_json(orient="records") print(json_results)

4.3 自定义可视化

import cv2 # 获取检测结果 detections = results.xyxy[0].numpy() # 在原图上绘制检测框 img_with_boxes = results.render()[0] # 显示结果 cv2.imshow('Detection Results', img_with_boxes) cv2.waitKey(0) cv2.destroyAllWindows()

5. 进阶使用技巧

5.1 批量处理图片

import glob # 批量处理文件夹中的所有图片 images = glob.glob('data/images/*.jpg') results = model(images) # 保存所有结果 results.save()

5.2 调整检测参数

# 设置置信度阈值（默认0.25） model.conf = 0.5 # 只显示置信度大于0.5的检测 # 设置IOU阈值（非极大值抑制） model.iou = 0.45 # 默认0.45 # 设置检测类别（只检测人和车） model.classes = [0, 2] # 0是人，2是车

5.3 使用GPU加速

# 检查GPU是否可用 device = 'cuda' if torch.cuda.is_available() else 'cpu' # 将模型移到GPU model = model.to(device) # 执行推理时确保输入也在GPU results = model(img.to(device))

6. 常见问题与解决方案

6.1 检测速度慢

可能原因：

使用了大模型(yolov5x)在CPU上运行
图片分辨率过高
批量处理时batch size设置过大

解决方案：

# 使用更小的模型 model = torch.hub.load('ultralytics/yolov5', 'yolov5n') # 调整图片大小 model.imgsz = 320 # 默认640 # 减小batch size model.batch_size = 4 # 默认16

6.2 检测结果不准确

可能原因：

目标物体太小
目标物体与训练数据差异大
光照条件差

解决方案：

# 使用更大的模型 model = torch.hub.load('ultralytics/yolov5', 'yolov5x') # 调整置信度阈值 model.conf = 0.4 # 降低阈值可能检测到更多物体 # 尝试不同的IOU阈值 model.iou = 0.3 # 降低IOU阈值可能减少误检

6.3 内存不足错误

可能原因：

图片分辨率过高
批量处理图片过多
GPU显存不足

解决方案：

# 减小图片尺寸 model.imgsz = 320 # 减小batch size model.batch_size = 2 # 使用CPU模式 model = model.cpu()

7. 总结与下一步建议

通过本教程，你已经掌握了使用YOLO-v5预训练模型进行物体检测的基本方法。以下是关键要点回顾：

快速部署：使用预构建镜像或简单pip安装即可开始
模型选择：根据需求在速度(yolov5n)和精度(yolov5x)之间权衡
灵活输入：支持本地文件、URL、OpenCV/PIL图像等多种输入格式
结果处理：提供多种格式输出和可视化选项
性能调优：通过调整参数优化检测效果和速度

下一步建议：

尝试在自己的数据集上微调模型
探索视频流实时检测
了解TensorRT加速部署
研究YOLO-v5与其他视觉任务的结合

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

查看全文

http://www.jsqmd.com/news/569336/

Next.js服务端渲染性能优化：5个实战技巧提效40%

3步轻松解锁旧Mac潜能：OpenCore Legacy Patcher完整指南

AI辅助开发：利用快马AI模型为openclaw插件注入智能解析与决策能力

Linux生产环境国密SM2加密踩坑记：手把手解决InvalidKeySpecException报错

鸿蒙线上crash排查方法-企业真实案例

vLLM-v0.17.1在实时语音交互场景的应用：与ASR/TTS系统联调

Qwen2.5-14B-Instruct在AI编剧赛道的突破：像素剧本圣殿Glitch标题交互体验分享

同样是 AI 写作，为什么你需要去 AI 味？

机床拖链直销厂家盘点：2026年市场表现一览，排屑机/机床钣金防护/钢板防护罩/机床拖链/风琴防护罩，机床拖链厂家推荐 - 品牌推荐师

MAI-UI-8B与Dify平台集成：低代码AI应用开发

人力资源管理一体化HR SaaS平台：为什么越来越多企业放弃拼凑式系统

利用Python多线程优化tkinter界面响应：告别卡顿与无响应

DeepSeek-R1-Distill-Llama-8B多模态prompt工程实践

Qwen3-Reranker-0.6B企业级应用：从部署到调优全攻略

GLM-4.1V-9B-Base开发入门：PyCharm专业版连接远程解释器进行模型调试

Apifox供应链投毒攻击--完整解析

OpenClaw 3.28 终章：从 “激进重构” 到 “稳健治理”，AI 智能体安全与体验的平衡之道

slam_toolbox实战：如何用低成本激光雷达实现室内机器人精准建图（附参数调优技巧）

腾讯VersaViT：多模态视觉理解新标杆

Linux 中的硬链接和软连接是什么，二者有什么区别？

Phi-4-mini-reasoning vLLM推理可观测性：OpenTelemetry tracing全链路追踪

企业级AI助手搭建：Qwen3-VL:30B+Clawdbot+飞书完整教程

Phi-3-mini-4k-instruct-gguf入门必看：q4-GGUF量化对中文语义保留的影响实测

Qwen3.5-9B快速入门指南：3步启动Web界面，开启你的多模态AI体验

从预测到归因：手把手教你用因果森林（grf）做特征重要性分析与亚组发现

postgresql数据库日志量异常原因排查

破局内卷：奥尔特云云盘，全场景一站式智能数据底座

如何简化 Active Directory 报表管理？

Qwen3-14B智能体（AI Agent）开发入门：从概念到实现

Claude Code 记忆系统真实运作：200 行索引上限如何在生产项目中制造沉默遗忘

YOLO-v5实战：用预训练模型快速检测图片中的物体

1. 引言：为什么选择YOLO-v5

2. 环境准备与快速部署

2.1 系统要求

2.2 快速安装

2.3 下载YOLO-v5代码

3. 使用预训练模型进行检测

3.1 加载模型

3.2 准备输入图片

3.3 执行推理

4. 结果处理与可视化

4.1 理解检测结果

4.2 结果可视化方法

4.3 自定义可视化

5. 进阶使用技巧

5.1 批量处理图片

5.2 调整检测参数

5.3 使用GPU加速

6. 常见问题与解决方案

6.1 检测速度慢

6.2 检测结果不准确

6.3 内存不足错误

7. 总结与下一步建议

相关文章：