当前位置: 首页 > news >正文

目标检测算法——YOLO

YOLOYou Only Look Once 的缩写,是目标检测(Object Detection)领域一个革命性的系列模型,由 Joseph Redmon 等人在 2016 年首次提出。

YOLO 的核心理念与 SSD 类似,它是一个单阶段(One-Stage)检测器,但它的方法更加激进和统一。


🚀 YOLO 的核心思想:统一检测

YOLO 的主要目标是实现极高的速度和实时性,它通过将整个目标检测任务(区域建议、特征提取、边界框回归和分类)整合到一个单一的回归问题中来完成:

1. 划分网格 (Grid System)

YOLO 将输入图像划分为一个 $S \times S$ 的网格 (Grid)

  • 负责制: 如果一个目标的中心点落在哪一个网格单元内,那么这个网格单元就负责检测该目标。

2. 直接预测 (Direct Prediction)

每个网格单元都会直接预测出以下信息:

  • 边界框 (Bounding Boxes): 预测 $B$ 个边界框的坐标和尺寸信息。
  • 置信度 (Confidence Score): 每个预测框的置信度,表示该框包含对象的可能性以及预测的准确性
  • 类别概率 (Class Probabilities): 该网格单元包含的目标属于 $C$ 个类别的概率分布。

YOLO 的最终输出是一个 $S \times S \times (B \times 5 + C)$ 的张量。

3. You Only Look Once

这个名字意味着:整个检测流程只需要对图像进行一次前向传播,就能直接得出所有目标的分类和定位结果,极大地加快了速度。


🆚 YOLO 与两阶段模型的对比

特性 YOLO (单阶段) Faster R-CNN (两阶段)
检测步骤 一步到位:作为回归问题,直接预测框和类别。 两步:RPN 提议 $\to$ 检测头精修。
速度 极快(能达到 45 FPS 甚至更高),是实时检测的首选。 较快,但通常慢于 YOLO。
背景误检 。因为它对整个图像进行全局推理,能更好地编码上下文信息。 较高。主要依赖于局部 RoI 的特征。
定位精度 原始版本相对较低。由于网格约束,难以精确预测高度重叠或小物体。 。RoI Align/Pooling 和两阶段精修保证了高精度定位。

迭代与发展(YOLO 系列)

原始 YOLO 模型的缺点在于定位精度较差,特别是对小物体和密集物体。后续的迭代版本不断解决了这些问题:

  • YOLOv2 (YOLO9000): 引入 Batch Normalization、使用锚框(Anchor Boxes)(与 SSD 类似)、使用多尺度训练,大幅提高准确率。
  • YOLOv3: 引入 FPN (特征金字塔网络) 结构,使用多个特征图进行预测(类似于 SSD),改善了对小物体的检测效果。
  • YOLOv4/v5/v7/v8: 这些版本在架构、数据增强、优化技巧(如 $1 \times 1$ 卷积的进一步应用)上不断改进,在速度和精度上都达到了新的平衡点,是目前业界应用最广泛的实时目标检测器之一。

总结:YOLO 以牺牲部分定位精度为代价,实现了目标检测的革命性提速,是目前最受欢迎的实时检测模型系列。

http://www.jsqmd.com/news/46577/

相关文章:

  • 【工具分享】如何快速地、可视化地跟其他同学沟通复杂逻辑——用代码画流程图
  • 2025年11月国内箱式变压器,干式变压器,油浸式变压器,高低压成套设备,箱式变电站源头厂家权威推荐与综合实力解析:力王电气集团有限公司
  • 2025年下半年箱式变压器,干式变压器,油浸式变压器,高低压成套设备,箱式变电站公司权威排名表单及选购指南
  • QMS系统选型指南——如何避免项目失败的陷阱‌
  • 2025年11月公布四川连体服、工作服、劳保服、残疾人服装定制源头厂家权威排名榜单及选购指南
  • 数字化质量管理变革之路——企业如何成功实施QMS系统‌
  • 2025年CNBD测评四川工作服、劳保服、连体服、残疾人服装品牌公司权威排名:金豆服饰领跑行业的技术实力解析
  • 目标检测算法——SSD
  • OIFC 2025.11.21 模拟赛总结
  • 2025针阀式热流道厂家一览:技术特色与应用优势
  • g linux
  • 2025国内喷码机厂家排名综合实力榜
  • 【迅为工业RK3568稳定可靠】itop-3568开发板Linux驱动开发实战:RK3568内核模块符号导出详解
  • 虚幻基础:行为树 - 指南
  • 集成Win10+Win11优化工具 Windows Manager v2.2.1 绿色便携版!C盘经常红温清理方法
  • C语言`FILE`结构体 与 Python文件对象 的对比
  • 2025质量可靠的义乌刺绣工厂推荐下,厂家品质深度分析
  • 2025 11月十大靠谱启闭机品牌盘点推荐,螺杆启闭机、卷扬启闭机、手动启闭机、手电两用启闭机 优势及应用分析
  • 推荐几家靠谱的刺绣厂家电话,2025刺绣厂家实力解析
  • 虚拟机共享文件夹实现自动挂载
  • 目标检测算法——R-CNN系列
  • 如何助力质量人员提高工作效率与绩效—供应商质量评审
  • 每周读书与学习-JMeter性能测试脚本编写实战(一)-如何实现用户需先登录,然后再请求别的接口
  • 详细介绍:【iOS】自动引用计数(一)
  • 时序数据库选型指南:为什么TDengine正在成为行业标准
  • 专业的技术文档 | Apache Pulsar 如何满足金融级的容灾场景
  • 通用型质量管理SaaS平台的构建逻辑与市场实践‌
  • SBDAF60V3-ASEMI可直接替代安世PMEG6030EP
  • Ubuntu 框架使用 Docker 部署 Jenkins 详细教程
  • function sql的错误处理方法