当前位置: 首页 > news >正文

无人机航拍小目标车辆检测太难?LMAD‑YOLO 一招搞定精度与速度!

点击蓝字

关注我们

关注并星标

从此不迷路

计算机视觉研究院

公众号ID计算机视觉研究院

学习群扫码在主页获取加入方式

https://pmc.ncbi.nlm.nih.gov/articles/PMC12262879/pdf/pone.0328248.pdf

计算机视觉研究院专栏

Column of Computer Vision Institute

本文提出了一套轻量化、高精度的解决方案 ——LMAD-YOLO,基于 YOLO11 改进,专为无人机航拍场景打造。

PART/1

痛点

现有 YOLO、SSD 等算法在无人机视角下,普遍遇到三个硬伤:

  1. 小目标特征弱:像素低、边缘糊,噪声一干扰就丢特征
  2. 复杂场景扛不住:遮挡、密集、光影变化,漏检误检高发
  3. 精度与速度打架:轻量模型丢精度,高精度模型太笨重

为此,研究者从边缘增强、多尺度感知、轻量下采样、多维特征融合四个方向全面升级。

PART/2

创新

LMAD-YOLO 在 YOLO11n 基础上,新增 4 个关键设计,个个直击痛点。

1. MultiEdgeEnhancer:边缘增强 + 去噪

  • 用平均池化平滑噪声,差分计算强化车辆边缘

  • 多尺度自适应池化,捕捉从细纹理到大轮廓

  • 效果:精确率 P 提升 2.2%,mAP50 提升 0.5%

MultiEdgeEnhancer 模块与 EdgeBooster 子模块结构

2. MSPF:大核注意力 + 空间金字塔池化

  • 把 13×13 大核卷积拆成 1×13+13×1,算力砍半,全局感受野拉满

  • 结合 SPPF 多尺度池化,深浅层特征跨通道交互

  • 效果:更好区分小目标与干扰,减少漏检

MSPF 与 SPPF 结构对比

3. ADown:轻量双分支下采样

  • 平均池化降空间尺寸,分两路保留细节 + 增强局部特征

  • 替代传统步幅卷积,不丢小目标特征

  • 效果:参数量↓18.5%,计算量↓15.8%,召回率↑1.9%

ADown 模块替换传统卷积下采样

4. MDFPN:多维扩散融合金字塔

  • 加入 Dasi 维度感知选择,自动权衡深浅特征权重

  • 多尺度扩散机制,特征在不同层双向流动

  • 效果:显著降低密集遮挡场景的误检 / 漏检

DASI 模块流程示意图

LMAD-YOLO 整体网络结构


PART/3

实验结果

1. 消融实验(核心指标对比)

在 DroneVehicle 数据集上,LMAD-YOLO 相对 YOLO11n:

  • 精确率 P:74.6% → 77.0%
  • 召回率 R:66.5% → 67.9%
  • mAP50:71.4% → 73.6%
  • 参数量仅2.42M,比基线还小

消融实验结果表

2. 对比主流 YOLO 系列

和 YOLOv3t/v5n/v8n/v9t/v10n/v11n/v12n 同台比拼:

  • mAP50 全场最高:73.6%
  • 精度接近 YOLOv3t,但参数量仅 1/4,计算量大幅降低

  • 实时性 FPS=197.3,满足无人机端边部署

主流模型对比实验结果

3. 泛化能力:跨数据集照样能打

在通用航拍数据集VisDrone2019上:

  • mAP50 达26.8%,与 YOLOv9t 并列第一

  • 夜间、遮挡、密集小目标场景稳定性突出

VisDrone 数据集泛化实验结果

4. 效果可视化

白天、夜间、遮挡、密集四场景对比:

  • LMAD-YOLO不漏检、不误分,热力图更聚焦目标

DroneVehicle 数据集检测效果对比

VisDrone 数据集检测效果对比

PART/4

总结与未来方向

亮点总结

LMAD-YOLO 做到了小目标检测的三重平衡

  1. 边缘清晰:MultiEdgeEnhancer 抑制噪声、强化轮廓
  2. 尺度鲁棒:MSPF+MDFPN 搞定多尺度与密集遮挡
  3. 轻量高效:ADown 降参量不降精度,适合机载部署

未来优化方向

  • 极端天气(雨 / 雾 / 雪)鲁棒性提升

  • 超小目标感受场继续扩大

  • 结合超分辨率与更强注意力机制


一句话总结:LMAD-YOLO 是目前无人机航拍车辆小目标检测的优质方案,精度高、重量轻、泛化强,工程落地价值拉满!



有相关需求的你可以联系我们!

END

转载请联系本公众号获得授权

计算机视觉研究院学习群等你加入!

ABOUT

计算机视觉研究院

计算机视觉研究院主要涉及深度学习领域,主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架,提供论文一键下载,并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!


往期推荐

🔗

  • YOLO-TLA:一种基于 YOLOv5 的高效轻量级小目标检测模型

  • ViT-YOLO:基于Transformer的用于目标检测的YOLO算法

  • SSMA-YOLO:一种轻量级的 YOLO 模型,具备增强的特征提取与融合能力,适用于无人机航拍的船舶图像检测

  • LUD-YOLO:一种用于无人机的新型轻量级目标检测网络

  • Gold-YOLO:基于聚合与分配机制的高效目标检测器

  • Drone-YOLO:一种有效的无人机图像目标检测

  • 「无人机+AI」“空中城管”

  • 无人机+AI:光伏巡检自动化解决方案

  • 无人机视角下多类别船舶检测及数量统计

  • 机场项目:解决飞行物空间大小/纵横比、速度、遮挡等问题引起的实时目标检测问题

  • 2PCNet:昼夜无监督域自适应目标检测(附原代码)

  • YOLO-S:小目标检测的轻量级、精确的类YOLO网络

  • 大改Yolo框架 | 能源消耗极低的目标检测新框架(附论文下载)

  • 改进的检测算法:用于高分辨率光学遥感图像目标检测

http://www.jsqmd.com/news/863776/

相关文章:

  • Tomodoro:解锁网页番茄钟的终极效率秘诀,你真的会用吗?
  • Windows键盘重映射终极指南:用SharpKeys打造个性化输入体验
  • 苏州二手钻石怎么估价?看懂4C参数轻松判断藏品真实价值 - 李宏哲1
  • AI Agent Skills:2026年AI编程助手的新扩展标准
  • 2026 年国内陕西西安地区黄升丹五大品牌排名及解析 - 十大品牌榜
  • 上海黄金回收精选:六家本地口碑门店对比帮你卖金不吃亏 - 专业黄金回收
  • GitHub Desktop中文汉化:3分钟让Git操作界面说中文
  • 开源WebRTC实时通信解决方案:如何用LiveKit Server构建企业级视频会议系统?
  • HoRain云--Claude Code 操作说明
  • Python自动化下载Google卫星地图:从零到专业的地理数据获取指南
  • Diablo Edit2终极指南:5分钟掌握暗黑破坏神2存档编辑技巧
  • 2026 年 5 月欧米茄售后焕新|全国维修中心升级迁址,匠心守护尊贵时计 - 速递信息
  • 从零打造可落地的直流电机 PID 驱动系统(五):通过蓝牙实现 STM32 程序的远程升级
  • C语言位域与位操作规范教程
  • Boilr与其他模板工具的对比:为什么选择这个简单快速的选择
  • 3步解决Windows更新卡顿:终极免费修复工具使用指南
  • hcxdumptool深度探索:从无线数据捕获到WPA安全分析的完整实战指南
  • 中小企业CRM选型指南:2026年8款高性价比横评 - Blue_dou
  • 郑州黄金回收哪家强?7店梯队排名,全区街道全覆盖真实测评 - 润富黄金珠宝行
  • 从零打造可落地的直流电机 PID 驱动系统(六):完整 STM32 蓝牙 OTA 升级工程代码与配置指南
  • 10分钟免费制作专业EPUB电子书:浏览器中的完整指南
  • Microsoft.Recognizers.Text性能优化与扩展开发:自定义实体识别实现
  • 避免吃亏上当 西安居民出手黄金实用经验分享 - 奢侈品回收测评
  • CANN/pypto累乘操作API文档
  • 2026 高炉炼铁智能化技术全景与演进路径~系列文章01:高炉炼铁工艺机理与智能化底层逻辑
  • 为什么选择nodeenv:深度对比nvm、nave等Node版本管理工具
  • 2026年中国营销服务商全景:从种草到AI GEO,品牌需要什么样的合作伙伴? - 数字营销分析
  • 鸣潮模组终极指南:15+游戏增强功能一键解锁
  • 如何在macOS上制作Windows启动盘:WinDiskWriter完整指南
  • 为什么有那么多以字母“C”开头的编程语言?C、C++、C#、CSS