当前位置：首页 > news >正文

YOLOv5-SI: 基于多尺度训练与测试的尺度不变性增强算法

news 2026/6/11 12:13:51

摘要

在目标检测任务中，尺度变化是影响检测精度的关键因素之一。本文提出了一种改进的YOLOv5算法——YOLOv5-SI（Scale-Invariant YOLOv5），通过多尺度训练策略和多尺度测试增强技术，显著提升了模型对尺度变化的鲁棒性。实验结果表明，在COCO、VisDrone和DOTA等具有显著尺度变化的数据集上，YOLOv5-SI相比原始YOLOv5在AP@0.5指标上分别提升了3.2%、5.7%和4.8%。本文详细阐述了算法原理、实现细节和实验分析，并提供了完整的代码实现。

1. 引言

1.1 背景与挑战

目标检测是计算机视觉领域的核心任务之一，广泛应用于自动驾驶、安防监控、遥感图像分析等场景。YOLO系列算法因其优秀的精度-速度平衡而备受关注，其中YOLOv5以其工程化程度高、部署方便等优势成为工业界的首选方案之一。

然而，实际应用中的目标尺度变化范围极大：

自动驾驶场景：近处车辆占据数百像素，远处车辆仅几十像素
遥感图像：船舶目标从几个像素到上百像素不等
无人机视角：高度变化导致目标尺度剧烈变化

原始YOLOv5采用固定尺度的训练和测试策略，难以应对这种多尺度场景。具体表现为：

小目标漏检：特征金字塔深层特征丢失细节信息
大目标截断：感受野不足以覆盖大目标
<

http://www.jsqmd.com/news/673649/

相关文章：

VBA和Python 如何使己有的Office应用程序自动化

人工智能（十一）- 什么是 Skills

Gitee CodePecker SCA：重新定义企业级软件供应链安全防护

Base64 Decode and Encode - Online

如何构建层次化任务体系：Tasks子任务管理的终极指南

5G NR协议实战：手把手教你理解DCI大小对齐的5个关键步骤（附避坑指南）

终极魔兽争霸III地图编辑器HiveWE：快速创建精美地图的完整指南

Cesium 3D可视化实战：给你的地理围栏加上‘跑马灯’特效（基于MaterialProperty自定义材质）

Windows的cmd运行编译器(cmd运行c/c++、python等)

搞定RAG高级RAG技巧：从Query改写到Prompt构建，看这篇就够了！

SVG圆形详解

Spring Framework 3.2 于 2013 年 12 月 12 日正式发布（General Availability，GA）

终极指南：如何在Mac上免费使用Xbox 360手柄玩游戏

深入理解kubectl-debug架构：从插件到代理的完整解析

【万字文档+PPT+源码】基于Java的平价汽车租赁系统-计算机专业项目设计分享

把闲置的CM311-1A机顶盒刷成Armbian服务器，保姆级教程（含balenaEtcher烧录与EMMC写入避坑指南）

告别数据乱码！深入调试HC32 UART：用逻辑分析仪抓包分析时序与错误

SpringBoot项目实战：手把手教你搞定阿里奇门SDK对接（含完整代码与避坑指南）

保姆级教程：Halcon灰度投影(gray_projections)从‘simple’到‘rectangle’模式全解析

Dify 2026多模态集成避坑手册：92%开发者忽略的模态对齐偏差校准、token截断容错与异构Embedding归一化技巧

别再只懂原理了！动手用C++实现一个Redis风格的LRU缓存（支持TTL过期）

避开GD32F103的‘软’坑：除了改延时，你的ADC+DMA配置真的对了吗？（附官方Demo对比心得）

题解：AcWing 487 金明的预算方案

企业级项目三：基于 Paimon 湖仓的 AI 数据分析平台

销量爆款背后的真相：先选场景，再做产品！

7个实用技巧：GitHub Actions自动化流程打造高效持续集成

基于改进YOLOv5的无人机航拍小目标检测算法研究

关于在vs2022中使用清单模式遇到的问题

PyQt5实战：用QtDesigner设计计算器UI并用PyUIC转换为Python代码

THREE.MeshLine入门教程：10分钟创建惊艳3D线条效果