当前位置: 首页 > news >正文

无人机航拍小目标检测太难?YOLO-MARS 一招搞定,精度暴涨 8.1%!

点击蓝字

关注我们

关注并星标

从此不迷路

计算机视觉研究院

公众号ID计算机视觉研究院

学习群扫码在主页获取加入方式

https://pmc.ncbi.nlm.nih.gov/articles/PMC12031147/pdf/sensors-25-02534.pdf

计算机视觉研究院专栏

Column of Computer Vision Institute

无人机航拍目标检测,一直被小目标太小、分布密集、互相遮挡三大难题卡脖子,漏检、误检层出不穷。今天给大家带来一篇最新顶刊论文:基于 YOLOv8n 改进的 YOLO‑MARS 模型,专门解决航拍小目标检测痛点,精度直接拉满!

PART/1

痛点

痛点直击:无人机检测到底难在哪?

无人机拍出来的图,天生就不好检测:

  • 目标又小又密,占像素极少,特征很弱

  • 背景复杂,遮挡严重,容易丢目标

  • 传统 YOLOv8n 对小目标不友好,深层网络容易丢失浅层细粒度特征

市面上的模型要么精度不够,要么参数量太大,不适合无人机端侧部署。

于是,团队基于最轻量的 YOLOv8n,做了四大硬核改进,推出 YOLO‑MARS。

PART/2

创新

四大创新点:轻量 + 高精度双在线

1. ERAC 模块:小目标特征 “抓得更牢”

把普通卷积换成增强残差注意力卷积

  • 扩大感受野,不放过微小目标

  • 加入 SE 通道注意力,重点强化小目标特征

  • 残差连接稳梯度,训练不崩

👉 效果:mAP50 直接 +1.8%,参数几乎没涨。

2. PD‑ASPP 模块:多尺度识别更轻更快

替换原 SPPF,用并行深度可分离空洞金字塔

  • 多分支并行提取不同尺度特征

  • 深度卷积降参量,减少计算冗余

  • 复杂背景也能精准区分小目标

👉 效果:mAP 再涨,参数反而降了 4.3%

3. SGCS‑FPN:浅层特征不丢失

专门解决 “深层网络丢小目标” 问题:

  • 新增浅层特征引导分支

  • 跨层建立语义关联,把浅层细粒度信息传给深层

  • 小目标再也不会被 “吞掉”

👉 效果:mAP50 猛涨5.4%,小目标检测质变。

4. WIoUv3 损失:框得更准

把 CIoU 换成动态加权 WIoUv3

  • 动态自适应惩罚,密集小目标定位更准

  • 非单调聚焦机制,专注高质量锚框

  • 边界回归更稳定,误检更少

👉 效果:最终精度再打磨,整体拉到最高。

【消融实验结果表】

PART/3

实验

实验炸场:比 YOLOv8n 强太多!

数据集:VisDrone2019(航拍小目标标准 benchmark,60% 都是小目标)平台:RTX 3090,训练 200 轮

核心结果(对比 YOLOv8n)

  • mAP50:32.8% → 40.9%暴涨 8.1%

  • mAP50:95:19.1% → 23.4%,提升 4.3%

  • 参数仅2.93M,比 YOLOv8s 轻近 4 倍

【对比实验结果表】

吊打一众主流模型

  • 优于 SSD、Faster‑RCNN、QueryDet

  • 强于 YOLOv5s/YOLOv7‑tiny/YOLOv11n

  • 比参数量更大的 RFAG‑YOLO 精度更高、更轻量

可视化效果杀疯了

【四类场景对比图:密集 / 夜间 / 遮挡 / 高空】

【雾霾天气对比图】

【HIT‑UAV 红外数据集对比图】

  • 密集人群:不漏检、不误判

  • 夜间 / 雾霾:依然稳准

  • 高遮挡 / 高空小目标:精准框出

PART/4

总结与展望

核心结论

YOLO‑MARS =轻量 YOLOv8n + 四大改进,完美适配无人机航拍小目标检测:

  • 小目标检出率大幅提升

  • 密集、遮挡、低光照、雾霾全场景稳健

  • 参数量小,适合端侧实时部署

未来方向

  • 模型剪枝、知识蒸馏进一步轻量化

  • 结合超分辨率,提升极端小目标效果


有相关需求的你可以联系我们!

END

转载请联系本公众号获得授权

计算机视觉研究院学习群等你加入!

ABOUT

计算机视觉研究院

计算机视觉研究院主要涉及深度学习领域,主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架,提供论文一键下载,并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!


往期推荐

🔗

  • YOLO-TLA:一种基于 YOLOv5 的高效轻量级小目标检测模型

  • ViT-YOLO:基于Transformer的用于目标检测的YOLO算法

  • SSMA-YOLO:一种轻量级的 YOLO 模型,具备增强的特征提取与融合能力,适用于无人机航拍的船舶图像检测

  • LUD-YOLO:一种用于无人机的新型轻量级目标检测网络

  • Gold-YOLO:基于聚合与分配机制的高效目标检测器

  • Drone-YOLO:一种有效的无人机图像目标检测

  • 「无人机+AI」“空中城管”

  • 无人机+AI:光伏巡检自动化解决方案

  • 无人机视角下多类别船舶检测及数量统计

  • 机场项目:解决飞行物空间大小/纵横比、速度、遮挡等问题引起的实时目标检测问题

  • 2PCNet:昼夜无监督域自适应目标检测(附原代码)

  • YOLO-S:小目标检测的轻量级、精确的类YOLO网络

  • 大改Yolo框架 | 能源消耗极低的目标检测新框架(附论文下载)

  • 改进的检测算法:用于高分辨率光学遥感图像目标检测

http://www.jsqmd.com/news/699267/

相关文章:

  • Voxtral-4B-TTS-2603开源可部署:Mistral官方权重+社区Web封装完整溯源
  • TLPI 第12章 读书笔记:System and Process Information
  • ARMv8架构PLB与RAS机制解析及优化实践
  • 2026北京高考冲刺一对一,如何选到梦中情班? - 品牌测评鉴赏家
  • 2026届毕业生推荐的十大AI写作工具横评
  • 如何将酷我音乐KWM格式转换为MP3?详细步骤与工具推荐
  • OpenCV图像特征提取:边缘与角点检测实战指南
  • intv_ai_mk11镜像免配置:健康检查接口+日志路径固化+服务状态可视
  • 【MCP 2026工业落地实战白皮书】:覆盖钢铁、能源、制造三大高危场景的7类适配陷阱与零故障部署清单
  • 【限时开放】VSCode 2026农业插件Early Access权限倒计时48小时:含独家GeoJSON农田边界自动校准模块(仅剩217个激活码)
  • 读2025世界前沿技术发展报告51干细胞
  • 智能安防中的视频分析与预警处置
  • 别再手动轮询了!用STM32CubeMX+DMA搞定ADC多通道采样,效率提升不止一点点
  • 【工业级MCP网关配置白皮书】:基于Linux内核4.19+DPDK 22.11的C++实现,含6份可审计配置清单
  • 软考-数据库系统工程师-五大经典查找算法原理与数据库应用
  • Phi-4-mini-reasoning部署案例:边缘服务器(Jetson AGX Orin)可行性评估
  • DeepTutor:基于智能体原生架构的个性化AI学习伴侣部署与实战指南
  • Ubuntu 安装CUDA 教程
  • 董永建《信息学奥赛一本通》(C++版)
  • 量化不确定性的庖丁解牛
  • 大数据分析专业毕设京东美妆产品数据集,数据量大概32150条
  • 【VSCode 2026日志筛选分析工具终极指南】:20年一线工程师亲测的5大高阶技巧,90%开发者还不知道
  • 游戏电竞护航陪玩源码系统小程序:从多端接单到俱乐部级运营的全开源护航平台 - 壹软科技
  • GoWxDump:如何快速实现微信聊天记录的深度取证分析?
  • MT5 Zero-Shot中文增强镜像效果展示:直播话术实时多样性生成
  • 避坑+自救:智能仓储物流项目烂尾的6个典型场景,附复活实战思路
  • Keras实战:构建Seq2Seq机器翻译模型
  • ROS小车CAN通信实战:从DBC文件到socketcan_bridge消息收发的避坑指南
  • KoboldAI终极指南:三步打造你的专属AI写作助手
  • 2026年长沙短视频运营与GEO豆包AI推广避坑指南:5大服务商深度横评 - 年度推荐企业名录