当前位置: 首页 > news >正文

大致了解不同种类目标检测算法

Q1:每类算法有哪些算法

Q2:每种算法是用来做什么的

Q3:每种算法的基本原理

Q3:每种算法的优点以及缺点

One-stage(无提案)目标检测模型

Yolo v1

用途:实时目标检测,将目标检测任务从两阶段转为一阶段

优点:快,全局上下文信息,泛化能力强,鲁棒性强,端到端训练,结构简单

缺点:精度较低,对小物体和密集物体效果差,

流程:

​ 1.将输入图像resize成$448448$,并且按照$77$进行网格划分,对于yolov1,这两个参数固定

​ 2.每个网格预测2个边框,在yolov1中,这个参数固定,共98个预测

​ 3.每个预测为:(x,y,w,h),confidence score,即边界框的中心坐标,宽度,高度和置信度分数;置信度分数表示:框中含有目标的可能性以及预测框与真实框的lou(交并比,0-1,越大表示越重合)

​ 4.置信度过滤:筛选掉置信度过低的预测框

​ 5.非极大值抑制(nms):对于同一个目标,可能有多个高度重叠的边界框,选择其中一个置信度最高的,抑制(删除)重叠程度过高(IOU)的边界框

​ 6.输出,对于每个检测到的目标,输出:

​ 边界框坐标:(x,y,w,h)或(x_min,y_min,x_max,y_max),表示一个矩形

​ 预测类别

​ 置信度分数

SSD

作用:克服yolov1在小目标检测方面的困难

优点:速度快,精度高,多尺度,端到端

缺点:依赖于预设的锚框,需要nms,需要精心设计负样本选择策略

流程:

​ 1.使用预训练模型(VGG16)作为骨干网络,提取特征,生成不同尺度的特征图

​ 2.在每个特征图上预设一系列具有不同尺寸和长宽比的锚框

​ 3.在每个尺度的特征图上,都附加了小卷积层(两个卷积核,一个分类一个回归)作为预测器,生成类别置信度和边界框回归偏移量

​ 4.置信度过滤

​ 5.nms

​ 6.得到结果

Two-Stage(提案+精修)目标检测模型

思路:生成候选区域,然后对候选区域进行分类和回归

RCNN

作用:解决了准确定位和识别多个目标的问题,相较于传统算法降低了计算复杂度

优点:精度高,对小目标检测效果好,cnn利用了预训练

缺点:速度较慢,时空复杂度较高,非端到端

流程:

​ 1.使用selective search方法生成1k~2k个候选区域,每个区域视为独立子图

​ 2.使用深度网络提取每个候选区域的特征

​ 3.将提取的特征送入每一类的svm的分类器,判断是否属于该类

​ 4.使用回归器精细修正候选框位置

Fast RCNN

作用:大幅提高了rcnn的性能

优点:训练速度提升,推理速度加快,精度更高,空间占用更小

缺点:依然依赖selective search外部算法,该算法依赖cpu,非端到端

流程:

​ 1.使用selective search方法生成1k~2k个候选区域

​ 2.输入图像到网络,将候选区域对应的候选框投影到特征图上获得相应特征矩阵

​ 3.使用ROI Pooling将每个特征图缩放到7*7大小,通过全连接层得到结果

Faster RCNN

作用:进一步提升了性能

优点:不再依赖selective search方法,实现了端到端,精度更高,速度更快

缺点:较为复杂,内存占用大,速度仍然不如单阶段算法

流程:

​ 1.使用CNN提取特征图

​ 2.使用Region Proposal Networks生成Region Proposals。使用softmax判断anchor(锚框)属于positive还是negativate样本,然后利用bbox regression修正anchors以获得精确的proposals(提案)

​ 3.将特征图与提案输入Roi Pooling层,综合信息后提取proposal feature maps,送入全连接层判定类别

​ 4.利用proposal feature maps计算proposal的类别,同时再次使用bbox regression获得检测框的精确位置

Anchor-free目标检测模型

这个分类和上两种不冲突,我觉得很有意思很新,所以单独拿出来讲一讲。

逐像素预测,每个像素都被看做候选中心点

Centernet

作用:通过检测目标中心点,并从该中心点回归(预测)目标的尺寸和局部偏移量从而实现预测

优点:无序锚框,无需nms,端到端

缺点:对重叠目标处理有限

流程:

​ 1.使用目标中心点表示物体

​ 2.使用中心点的特征预测中心点偏移量和目标框的长,宽

​ 3.每个中心点只产生一个框,故无需nms,实现了端到端

http://www.jsqmd.com/news/835882/

相关文章:

  • 昆明罗丹艺术培训学校师资水平详细解析:核心资质配置与教学管理服务标准一览 - 云南美术头条
  • 室内装修设计施工如何做线上推广?2026全网获客指南与服务商盘点 - 精选优质企业推荐官
  • 2026年5月南充区域广告设计制作(LED显示屏、显示屏租赁,显示屏搭建)安装价格 - 四川华蔓广告有限公司
  • 冷库仓储物流配送如何做网络推广?2026全网获客指南与服务商盘点 - 精选优质企业推荐官
  • 2026年4月篷布品牌口碑推荐,帆布/红黑篷布/篷布/防雨布/机械苫盖/外红内黑/三防布/PE红黑布,篷布企业有哪些 - 品牌推荐师
  • 笔记:创建MicroBlaze工程(使用示例工程)
  • 微调和RAG学习笔记:同一个问题它们分别怎么处理
  • 贵州劳保用品批量供应如何做线上推广?2026全网获客指南与服务商盘点 - 精选优质企业推荐官
  • 常用网络命令以及文件
  • 贵州门窗安装销售服务如何做线上推广?2026全网获客指南与服务商盘点 - 精选优质企业推荐官
  • 门窗安装销售如何做线上推广?2026年全网获客指南与服务商选型 - 精选优质企业推荐官
  • 航空器配载管理系统三次作业总结
  • 贵州汽车美容洗护改装如何做线上推广?2026全网获客指南与服务商盘点 - 精选优质企业推荐官
  • 摄影写真拍摄服务如何做线上推广?2026年全网获客指南与服务商选择 - 精选优质企业推荐官
  • 2026年5月南充区域广告设计制作(PVC板雕刻,KT板,车贴)安装价格 - 四川华蔓广告有限公司
  • 2026年4月国内服务好的拓竹官方代理商批发厂家推荐,企业研发3D打印机/碳纤维增强3D打印,拓竹官方代理商品牌找哪家 - 品牌推荐师
  • 2026年甄选:无缝钢管维修品牌 - 品牌推广大师
  • 贵州瓷砖卫浴建材销售如何做线上推广?2026年本地获客指南与服务商盘点 - 精选优质企业推荐官
  • 作业总结
  • 贵阳企业团建活动策划如何做线上推广?2026全网获客指南与服务商盘点 - 精选优质企业推荐官
  • 贵阳门窗安装销售如何做线上推广?2026全网获客指南与服务商推荐 - 精选优质企业推荐官
  • 从本地目录理解 Lance Dataset:Manifest、Fragment 与 Blob
  • 贵州驾照培训如何做线上推广?2026本地获客指南与服务商盘点 - 精选优质企业推荐官
  • 2026年5月南充区域广告设计制作(喷绘写真,平板UV喷印,亚克力字)安装价格 - 四川华蔓广告有限公司
  • 2026年5月南充区域广告设计制作(灯光舞台,演艺主持,泡沫板)安装价格 - 四川华蔓广告有限公司
  • 初学 Java 接口学习心得
  • HarmonyOS 5.0 PC应用开发实战:构建跨设备协同的桌面生产力工具
  • 贵阳驾照培训如何做线上推广?2026驾培行业获客指南与服务商盘点 - 精选优质企业推荐官
  • 贵阳门窗安装销售服务如何做线上推广?2026全网获客指南与服务商盘点 - 精选优质企业推荐官
  • 贵阳成人职业技能培训如何做线上推广?2026全网获客与GEO优化指南 - 精选优质企业推荐官